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Beschreibung 

[0001] Die Erfindung betrifft ein Hepatitis C Virus (HCV) Zellkultursystem, das im wesentlichen eukaryontische Zel- 
len umfa&t, die eingeschleustes HCV-spezifisches Genmaterial enthalten, d.h. die mit HCV-spezifischem Genmaterial 
s transfiziert sind. 

[0002] Das Hepatitis C Virus (HCV) ist eine der Hauptursachen chronischer und sporadischer Leberkrankungen 
weltwe'rt. Die meisten HCV-lnfektionen verlaufen ohne erkennbare Winische Symptome. allerdings werden 80-90% der 
Infizierten dauerhafte Virustrager und bei 50% dieser dauerhaften Virustrager kommt es zu einer chronischen Leber- 
entzOndung mrt unterschiedlichen Schweregraden. Ca. 20% der chronisch Infizierten entwickeln im Lauf e von 1 0 bis 20 

io Jahren eine Leberzirrhose, auf deren Basis sich ein primares Leberzellkarzinom entwickeln kann. Die chronische 
Hepatitis C ist heute die Hauptindikation fur eine Lebertransplantation. Eine Kausaltherapie gibt es bisher noch nicht. 
Die einzigederzeit verfOgbare Therapie ist die hochdosierte Verabreichung von Interferon- Alpha oder eine Kombination 
aus Interferon-Alpha und dem Purin-NuMeosidanalogon Ribavirin. Allerdings sprechen nur ca. 60 % aller Behandelten 
auf diese Therapie an und bei diesen kommt es in mehr als der Halfte aller Falle nach dem Absetzen der Behandlung 

is zu einer erneuten Viramie. 

Aufgrund der hohen Pravalenz, gerade auch in den Industrielandem. den schwerwiegenden Folgen chronischer Infek- 
tionen und dem Fehlen einer Kausaltherapie ist die EntwicWung einer HCV-spezifischen Chemotherapie ein wesentli- 
ches Zel der pharmazeutischen Forschung und EntwicWung. Hauptproblem hierbei ist bisher das Fehlen eines 
geeigneten Zellkultursystems, das ein Studium der Virus-Replikation und der Pathogenese in eukaryontischen Zetien 

20 ermoglicht 

[0003] Aufgrund der geringen Virusmengen im Blut bzw. Gewebe. dem Fehlen geeigneter Zellkultursysteme oder 
Tiermodelle (bis heute ist der Schimpanse das einzige mogliche Versuchstier) sowie dem Fehlen effizienter Systeme 
zur Produktion virus-ahnlicher Partikel, konrrte die molekulare Zusammensetzung des HCV-Partikels bis heute noch 
nicht eingehend untersucht bzw. aufgeWart werden. Die derzert vorliegenden Ergebnisse lassen sich wie folgt zusam- 

25 menfessen: Das HCV ist ein umhOIItes Plusstrang RNA Virus mit einem Partikeldurchmesser von 50-60 nm und einer 
mittleren Dichte von 1.03-1,1g/ml. Es wurde erstmals 1989 molekular Wordert und charakterisiert (Choo et al., 1989: 
Science. 244, 359-362). Die HCV- RNA hat eine Lange von ca. 9.6 kb (= 9600 NuWeotide), eine positive Polaritat und 
bestet ein einziges offenes Leseraster (ORF = open reading frame), das ein lineares Polyprotein von ca 3010 Amino- 
sauren kodiert (siehe Rice 1996. in Virology, B. N. Fields, D. M. Knipe. P. M. Howley. Eds. (Lippincott-Raven. Philadel- 

30 phia. PA. 1996). vol. 1, pp.931 -960; Clarke 1997. J. Gen. Virol. 78, 2397; und Bartenschlager 1997. Intervirology 40, 
378 und vgl. Fig. 1 A). Bei der Virusreplikation wind das Polyprotein durch zellulare und virale Proteasen in die reifen 
und f unktionell aktiven Proteine gespattea 

Innerhalb des Polyproteins sind die Proteine wie folgt angeordnet (vom Amino- zum Carboxyterminus): Core-E1 -E2-p7- 
NS2-NS3-NS4A-NS4B-NS5A-NS5B. Das Core-Protein ist die Hauptkomponerrte des NuWeokapsids. Die Glykoprote- 

35 ine E1 und E2 sind Transmembranproteine und Hauptkomponenten der VlrushOlle. Sie spielen wahrscheinlich bei der 
Anheftung des Virus an die Wirtszelle eine wesentiiche Rolle. Diese drei Proteine Core, E1 und E2 bauen den Virus- 
partikel auf und werden deshalb als Strukturproteine bezeichnet Die Funktion des Proteins p7 ist noch unklar. Das Pro- 
tein NS2 ist wahrscheinlich die katalytische Domane der NS2-3 Protease, die fur die Prozesierung zwischen den 
Proteinen NS2 und NS3 verantwortlich ist Das Protein NS3 hat zwei Funktionen, namlich in der aminoterminalen 

40 Domane eine Proteaseaktivitat, die fur die Polyproteinprozessierung essentiell ist, und in der carboxyterminalen 
Domane eine NTPase/Helikase-Funktion, die wahrscheinlich bei der Replikation der viralen RNA eine Rolle spielt. Das 
Protein NS4A ist ein Kbfaktor der NS3-Protease. Die Funktion des Proteins NS4B ist unbekannt 
[0004] Das offene Leseraster ist an seinem 5' Ende von einer ca 340 NuWeotide langen nicht-translatierten Region 
(NTR = non-translated region) flankiert, die als interne Ribosomenansatzstelle (IRES = internal ribosome entry site) 

45 fungiert, und an seinem 3' Ende von einer ca. 230 NuWeotide langen NTR, die hochstwahrscheinlich fOr die Genomre- 
plikation von Bedeutung ist Eine solche 3' NTR ist Gegenstand der Patentanmeldung PCT/US 96/14033. Die Struktur- 
proteine in dem amino-terminalen Viertel des Polyproteins werden von der Signalpeptidase der Wirtszelle gespalten. 
Die Nicht-Strukturproteine (NS) 2 bis (NS) SB werden von zwei viralen Enzymen prozessiert, namlich von der NS2-3 
und der NS3/4A Proteinase. Die NS3/4A Proteinase wird fur alle Spaltungen jenseits des Carboxyterminus von NS3 

so benotigt. Die Rolle von NS4B ist nicht bekannt. NS5A, ein noch phosphoryliertes Protein, scheint fQr die Interferon 
Resistenz verschiedener HCV-Genotypen verantwortlich zu sein (vgl. Enomoto et al. 1995, J. Clin. Invest 96, 224; 
Enomoto et al. 1996, N. Engl. J. Med 334, 77; Gale Jr. et al. 1997, Virology 230, 217; Kaneko et al. 1994, Biochem. 
Biophys. Res. Commun. 205, 320; Reed etal., 1997, J. Virol. 71, 7187) und NS5B wurde als die RNA-abhangige RNA 
Polymerase identifiziert 

55 [0005] Anhand dieser Erkenntnisse wurden erste Diagnosesysteme entwickelt, die entweder auf dem Nachweis 
von HCV-spezifischen Antikorpern in Patientenserum oder auf dem Nachweis von HCV-spezifischer RNA mittels RT- 
PCR (- Reverse Transcription Polymerase Chain Reaction) beruhen, und die mittlerweile routine- und/oder vorschr'rfts- 
maBig bei alien Blutkonserven angewendet werden (mussen). 
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[0006] Seit der Erstbeschreibung des Genoms 1 989 wurden mit Hilfe der PCR-Methode zahlreiche Teil- und Kom- 
plettsequenzen des HCV Woniert und charakterisiert Ein Vergleich dieser Sequenzen zeigt eine hohe Variability des 
viralen Genoms. insbesondere im Bereich des NS5B-Gens, was letztendlich zu einer Einteilung in 6 Genotypen gefQhrt 
hat die selbst nochmals in Subtypen a, b, und c untergliedert sind. Die genomische Varianz ist nicht gleichmSBig Qber 
5 das Genom verteili So sind die 5'NTR und Teile der 3'NTR hoch konserviert, w&hrend bestimmte kodierende Sequen- 
zen z.T. sehr stark variieren, vor allem die HQIIproteine E1 und E2. 

[0007] Die Wonierten und charakterisierten Teil- und Komplettsequenzen des HCV-Genoms wurden auBerdem hin- 
sichtlich geeigneter Angriffsziele for ein prospektives antivirales Therapeutikum untersucht. Dabei wurden drei virale 
Enzyme gefunden, die sich als solches Angriffsziel anbieten. Diese sind (1) der NS3/4A Proteasekomplex, (2) die NS3 

io Helikase und (3) die NS5B RNA-abhangige RNA Polymerase. Der NS3/4A Proteasekomplex und die NS3 Helikase 
konnten bereits kristallisiert und hinsichtlich ihrer dreidimensionalen Struktur aufgeWart werden (Kim et al.. 1996. Cell. 
87.343; Yem et al., 1998. Protein Science. 7. 837; Love et al.. 1996. Cell. 87. 31 1 ; Kim et al.. 1998. Structure, 6. 89; Yao 
et al., 1997, Nature Structural Biology. 4, 463, Cho et al... 1998. J. Biol. Chem., 273. 15045); bei der NS5B RNA-abhan- 
gigen RNA Polymerase ist dies bis heute noch nicht gelungen. 

is Obwohl mit CGesen Enzymen bedeutsame Angriffsziele fur eine TherapieentwicWung der chronischen HCV-lnfektion 
definiert sind, und obwohl sowohl mit Hilfe von 'rational drug design* als auch mit Hilfe von 'high throughput screens* 
weltwe'rt intensiv nach geeigneten Inhibitoren gesucht wird. leidet die TherapieentwicWung an einem groBen Defizit, 
namlich dem Fehlen von Zellkultursystemen Oder einfachen Tiermodellen, die es erlauben, HCV- RNA oder HCV-Anti- 
gene direkt, zuveriassig und mit einfachen laborGblichen Methoden nachzuweisen. Das Fehlen solcher Zellkultursy- 

20 steme ist auch der Hauptgrund dafOr, daB das Verstandnis der HCV-Replikation bis heute noch sehr IQckenhaft und in 
weiten Teilen nur hypothetisch ist 

[0008] Obwohl nach Meinung der Fachwelt eine enge evolutiona/e Beziehung zwischen HCV und den Ravi- und 
Pestiviren besteht und fOr diese autonom replizierende RNAs beschrieben sind. die in verschiedenen Zellinien ohne 
weiteres zur Replikation gebracht werden konnen und dabei relativ hohe Ausbeuten zeigen ( siehe Khromykh et al., 
25 1997, J. Virol 71. 1497; Behrens et al.. 1998. J.Virol 72, 2364; Moser et al., 1998. J. Virol 72. 5318). waren ahnliche 
Versuche mit HCV bisher nicht erfolgreich. 

[0009] Zwar ist aus verschiedenen Publikationen bekannt, daB Zellinien oder primare Zellkulturen mit HCV-halti- 
gem. hochtitrigem Patient enserum infiziert werden konnen, (Lanford et al. 1994, Virology 202, 606; Shimizu et al. 1993. 
Procedings of the National Academy of Sciences, USA. 90. 6037-6041; Mizutani et al. 1996, Journal of Virology, 70, 

30 7219-7223; M. Ikedaetal. 1998. Virus Res. 56. 157; Fburnier et al. 1998, J. Gen. Virol 79. 2376 und darin zitierte Lite- 
raturstellen, Ito et al. 1996, Journal of General Virology, 77, 1043-1054). diese virusinfizierten Zellinien oder Zellkultu- 
ren erlauben jedoch nicht den direkten Nachweis von HCV- RNA oder HCV-Antigenen. Die virale RNA in diesen Zellen 
ist weder in einem Nothern-Blot (einem Standardverfahren zum quantitativen Nachweis von RNA) noch sind die viralen 
Protein in einem Western-Blot oder mittels ImmunprSzipitation detektierbar. Nur mit sehr aufwendigen und indirekten 

35 Methoden ist es uberhaupt gelungen, eine HCV-Replikation nachzuweisen. Diese nachteiligen Umstande zeigen War, 
daB die Replikation in diesen bekannten virusinfizierten Zellinien oder Zellkulturen absolut unzureichend ist. 
[001 0] Desweiteren ist aus den Publikationen von Yoo et al. (1 995, Journal of Virology, 69, 32-38) und von Dash et 
al., (1997, American Journal of Pathology, 151 , 363-373) bekannt. daB Hepatomazellinien mit synthetischer HCV-RNA, 
die mittels in vitro Trankription von kloniertem HCV-Genom gewonnen wurde, transfiziert werden kOnnen. In beiden 

40 Publikationen gingen die Autoren von dem Grundgedanken aus, daB das virale HCV-Genom eine Plusstrang-RNA ist, 
die nach dem Einschleusen in die Zelle direkt als mRNA fungiert, an die sich Ribosomen anheften und im Zuge von 
Translationsprozessen Virusproteine bilden. aus denen sich letztendlich neue HCV-Partikel bilden (kGnnen). Diese 
Virusreplikation, d.h. diese neu gebildeten HCV- Wen bzw. deren RNA wurde mittels RT-PCR nachgewiesen. Die publi- 
zierten Ergebnisse der durchgefuhrten RT-PCR sprechen jedoch dafOr, daB die Effizienz der HCV-Replikation in den 

45 beschriebenen HCV-transfizierten Hepatomazellen nur sehr gering ist und jedenfalls nicht ausreicht, um Schwankun- 
gen in der Replikationsrate nach gezielter Einwirkung mit prospektiven antiviralen Therapeutika auch nur qualitativ, 
geschweige denn quantitativ zu messen. AuBerdem ist im Stand der Technik mittlerweile bekannt (Yanagi et at., Proc. 
Natl. Acad. Sci. USA, 96, 2291-95, 1999), daB die hochkonservierte 3' NTR esserrtiell ist fur die Virusreplikation, was 
in Warem Widerspruch zu den Behauptungen von Yoo et al. und Dash et al. stent, die fur ihre Versuche in Unkenntnis 

so des authentischen 3' Endes des HCV-Genoms ausschlieBlich HCV-Genome mit verkurzten 3' NTRs verwendet haben. 
[0011] Aufgabe der vorliegenden Erfindung ist die Bereitstellung eines HCV- Zellkultursystems, bei dem die virale 
RNA in den transf izierten Zellen autonom und mit so hoher Effizienz repliziert, daB Schwankungen in der Replikations- 
rate nach gezielter Einwirkung mit virus- und insbesondere HCV-spezrfischen prospektiven antiviralen Therapeutika 
qualitativ und quantitativ und mit Hilfe gangiger, laborublicher MeBverfahren gemessen werden konnen. 

55 [001 2] Eine Losung dieser Aufgabe besteht in der Bereitstellung eines Zellkultursystems der eingangs genannten 
Art, bei dem die eukaryontischen Zellen humane Zellen. insbesondere Hepatomazellen sind, die vorzugsweise von 
einer handelsublichen Hepatomazellinie abstammen, aber auch aus einer entsprechenden Primarzellkultur gewonnen 
sein kdnnen, und bei dem das eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt ist das im 
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wesentlichen die HCV-spezifischen RNA-Abschnrtte 5' NTR. NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR, vorzugs- 
weise in der genannten Reihenfblge, und zudem wenigstens ein selektierbares Markergen (Selektionsgen) umfaBt 
"NTR" stent hier und im folgenden f Qr "nicht-translatierte Region" und ist dem einschlagigen Fachmann als Begriff bzw. 
AbkOrzung bekannt und gelaufig. Der Begriff "HCV-RNA-Konstrukt" umfaBt hier und im folgenden sowohl Kbnstrukte, 
5 die das komplette HCV-Genom enthalten, als auch solche, die lediglich einen Teil davon, d.h. ein HCV-Subgenom ent- 
halten. 

Eine bevorzugte Variarrte des erfindungsgemaBen Zellkultursystems, die sich in der Praxis sehr gut bewahrt hat, ist 
unter der Nummer DSM ACC2394 (Laborbezeichnung HuBI 9-13) bei der DSMZ, Deutsche Sammlung von Mikroorga- 
nismen und Zellkulturen GmbH in Braunschweig, Deutschland, hinterlegt. 

io [001 3] Mit dem erfindungsgemaBen Zellkultursystem wird erstmals ein in-vitro-System bereit gestelft, in dem HCV- 
RNA intrazellular, autonom und in ausreichend groBen Mengen repliziert und exprimiert wird, so daB eine quantitative 
Bestimmung sowohl der HCV-RNA-Mengen als auch der HCV-spezifischen Proteine mit konventionellen und zuverlas- 
sig genauen biochemischen MeBmethoden durchgefOhrt werden kann. Das heiBt: es stent erstmals ein annahernd 
authentisches zellgestutztes ("cell-based! HCV-Replikationssystem zur VerfOgung, das fur die EntwicWung und Erpro- 

is bung von antiviralen Pharmazeutika dringend benOtigt wird. Dieses Testsystem bietet nun die Moglichkeit potentielle 
Angriffsziele fQr eine wirksame HCV-spezif ische Therapie zu identif izieren und HCV-spezif ische Chemotherapeutika zu 
entwickeln und zu evaluieren. 

[001 4] Die Erf indung basiert auf der Oberraschenden Erkenntnis. daB eine eff iziente Replikation der HCV-RNA nur 
dann in Zellen stattfindet wenn diese mit einem HCV-RNA-Konstrukt transfiziert wurden, das mindestens die 5' und die 

20 3* nicht-translatierten Regionen (NTR) und die Nichtstrukturproteine (NS) 3 bis 5B umfaBt und zusatzlich ein selektier- 
bares Markergen (Selektionsgen) aufweist Offensichtlich sind die Strukturgene fur den Ablaut der Replikation ohne 
wesentfiche Bedeutung, wahrend andererseits eine effiziente Replikation der HCV-RNA anscheinend nur dann stattfin- 
det wenn die transfizierten Zellen einem permanenten Selektionsdruck unterzogen werden, der durch das mit der 
HCV-RNA verbundene selektierbare Markergen (Selektionsgen) vermittelt wird. Das Markergen (Selektionsgen) 

25 scheint somit einerseits die Selektion derjenigen Zellen zu provozieren, in denen die HCV-RNA produktiv repliziert und 
andererseits scheint es die Effizienz der RNA-Replikation wesentlich zu steigern. 

[0015] Gegenstand der Erf indung ist auch ein zellfreies HCV-RNA-Kbnstrukt das sich dadurch auszeichnet, daB 
es die HCV-spezifischen RNA-Abschnrtte 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR, vorzugsweise in der 
genannten Reihenfolge, und zudem ein seleklierbares Markergen (Selektionsgen) umfaBt 
30 [0016] Der Begriff 5* NTR bzw. NS3 bzw. NS4A bzw. NS4B bzw. NS5A bzw. NS5B bzw. 3* NTR umfaBt im voriie- 
genden Zusammenhang jede NuWeotidsequenz, die im Stand der Technik als NuWeotidsequenz fur den jeweils betref- 
fenden f unktionellen Abschnitt des HCV-Genoms beschrieben ist 

[0017] Die Bereitstellung eines solchen HCV-RNA-Konstrukts ermoglicht erstmals eine detaillierte Analyse der 
HCV - Replikation, - Pathogenesis und - Evolution in Zellkulturen. Die HCV-spezifische virale RNA kann - als vollstan- 
35 diges Genom oder als Subgenom - gezielt in beliebigen Mengen erzeugt werden, und es besteht die Moglichkeit das 
RNA-Kbnstrukt zu manipulieren und damit die HCV-Funktionen auf genetischer Ebene zu untersuchen und aufzuWa- 
ren. 

[001 8] Da alie zur Zeit als Hauptangriffsziel fur eine Therapie untersuchten HCV-Enzyme, namlich die NS3/4A Pro- 
tease, die NS3 Helikase und die NS5B Polymerase, in dem erfindungsgemaBen HCV-RNA-Kbnstrukt enthalten sind, 

40 kann es fQr alle entsprechenden Untersuchungen benutzt werden. 

[001 9] Eine AusfOhrungsform des HCV-RNA-Kbnstrukts, die sich in der praktischen Anwendung sehr gut bewahrt 
hat zeichnet sich dadurch aus, daB sie die NuWeotidsequenz gemaB Sequenzprotokoll SEQ ID NO:1 umfaBt 
Weitere Ausfuhrungsvarianten mit vergleichbar guten Eigenschaften fQr den Einsatz in der Praxis sind dadurch 
gekennzeichnet, daB sie eine NuWeotidsequenz entweder gemaB Sequenzprotokoll SEQ ID N05 oder SEQ ID NO:3 

45 oder SEQ ID NO:4 Oder SEQ ID NO:5 oder SEQ ID NO:6 oder SEQ ID NO:7 oder SEQ ID NO:8 Oder SEQ ID NO:9 
oder SEQ ID NO:10 oder SEQ ID NO:1 1 umfassen. 

[0020] Es besteht die Moglichkeit das erfindungsgemaBe HCV-Subgenom-Kbnstrukt mit einer 3* NTR zu verse- 
hen, die eine im Stand der Technik hierfQr bisher unbekannte NuWeotidsequenz aufweist namlich eine NuWeotidse- 
quenz, die aus der Gruppe der nachfolgend aufgelisteten NuWeotidsequenzen (a) bis (i) ausgewahlt ist: 

50 
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(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTG1 1 1 1 1 1 111 11 A 
GCTTTTI 11 1 1 11 r cr rr i'H' 1 'l T GAGAGAGAGAGTCTCACTCTGTTGCCC 
AGACTGGAGT 

(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGrnTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GCAGC 

(d) ACGGGGAGCT AAAC ACTCC AGGCC AAT AGGCC ATCCTG lllll 1 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTC ACTC 
TGTTGCCCAG ACTGGAGT 

(e) ACGGGGAGCT AAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTT AGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTC ACTC 
TGTTGCCCAG ACTGGAGT 

(£) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 

TTTTTAGTCT TTTTTT T TT T TCTTTTTTTT TTGAGAGAGA GAGTCTCACT 
CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACrcCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

CO ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
I'lT' l ' l ' l ' A ATC TTTTTTT T TT TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 



Das in den erfindungsgemaBen HCV-RNA-Konstrukten enthaltene selektierbare Markergen (Selektionsgen) ist vor- 
zugsweise ein Resistenzgen. insbesondere eine Antibiotikumresistenzgen. 

Das hat den Vorteil, daB die mit diesem Konstrukt transfizierten Zellen leicht von den nicht transfizierten Zellen selek- 
tiert werden konnen. indem dem Zellkulturmedium z.B. im Fall eines Antibiotikumresistenzgens das betreffende Ant- 
biotikum zugegeben wird. Unter Antibiotikum' witd im vorliegenden Zusammenhang jede Substanz verstanden, die die 
nicht-transfizierten Wirtszellen oder die Zellen, in denen die HCV-RNA nur mit geringer Effizienz r^jliziert. am Leben 
Oder Wachstum hinder!, insbesondere Zellgifte wie z.B. Puromycin, Hygromycin. Zeocin. Bleomycin oder Blasticidin. 
[0021] Ein bevorzugtes selektierbares Markergen (Selektionsgen) bzw. Resistenzgen, das sich in der Praxis sehr 
gut bewahrt hat, ist das Neomycinphosphotransferasegen. 

[0022] Eine Alternative zu den Antibiotikumresistenzgenen ist z.B. das Thymidin-Kinase-Gen, mit dem eine HAT- 
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Selektion durchgefuhrt werden kann. 

[0023] Die Position des selektierbaren Markergens (Selektionsgens), bzw. des bevorzugten Resistenzgens bzw. 
des besonders bevorzugten Antibiotikumresistenzgens in dem HCV-RNA-Kbnstrukt liegt vorzugsweise hinter der HCV 
5' NTR, d.h. strangabwarts der 5* NTR bzw. strangaufwarts des HCV-Leserasters. Denkbar ist aber auch eine Insertion 

s im Bereich der 3' NTR Oder an anderer Stelle des HCV-Genoms oder -Subgenoms, z.B. innerhalb des Polyproteins. 
[0024] Bei einer alternativen Ausfuhrungsfbrm des erf indungsgemaBen HCV- RNA-Konstrukts ist das seiektierbare 
Markergen (Selektionsgen), insbesondere ein Antibiotikumresistenzgen, Qber ein Ribozym bzw. eine Erkennungsstelle 
f Or ein Ribozym mit der HCV-RNA bzw. der HCV-Genom- oder -Subgenomsequenz verbunden. 
[0025] Damit gent der Vorteil einher, daB nach erfolgter Selektion derjenigen Zellen, in denen die HCV-RNA pro- 

io duktiv repliziert, in den daraus gewonnenen Zellkionen das Resistenzgen durch ribozymvermrttette Spartung von der 
HCV-Subgenomsequenz abgetrennt werden kann, namlich durch Aktivierung des einWonierten Ribozyms Oder, im Fall 
eines Konstrukts mit einer Erkennungsstelle fur ein Ribozym, durch Einschleusen des Ribozyms in die Zellen (z.B. mit- 
tels Transfektion eines Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entspre- 
chende Ribozym eingesetzt wurde). Auf diese Weise wird ein authentisches HCV-Genom-Kbnstrukt ohne 

75 Resistenzgen erhalten, das zur Bildung authentischer infekbdser Viruspartikei befahigt ist. 

[0026] Eine weitere bevorzugte AusfOhrungsfbrm des erfindungsgemaBen HCV- RNA-Konstrukts zeichnet sich 
dadurch aus, daB das Konstrukt wenigstens ein integriertes Reportergen aufweist. 

[0027] Unter Reportergen wird im tblgenden jedes Gen verstanden. dessen Anwesenheit sich nach Uberfuhrung 
in einen Ztelorganismus leicht und im allgemeinen mit einfachen biochemischen oder auch histochemischen Methoden 
20 nachweisen laBt, d.h. das fur ein Protein kodiert, welches auch in geringen Mengen einfach und zuverlassig mit den 
laborublichen MeBmethoden nachgewiesen und quarrtifiziert werden kann. 

[0028] Diese Variante des HCV- RNA-Konstrukts hat den Vorteil, daB der Umfang der Replikation dieses Konstrukts 

anhand des Reportergenprodukts einfach und schnell mit laborublichen Methoden gemessen werden kann. 

[0029] Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloram- 

25 phenicol-Acetyl-Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), dem GFP-Gen (green-fluorescence-pro- 
tein-Gen ), dem GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (Sezemerte-AIkalische-Phosphatase-Gen). 
Diese Reportergene bzw. deren Produkte, namlich die entsprechenden Reporterproteine, kdnnen z.B. mittels Fluores- 
zenz, Chemilumineszenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z.B. ELISA) bestimmt werden. 
[0030] Als Reportergen kommt aber auch ein Surrogatmarkergen in Betracht. Darunter sind in diesem Zusammen- 

30 hang solche Gene zu verstehen, die fur zellulare Proteine, NuWeinsauren oder — allgemein -4Gr solche Funktionen 
kodieren, die einer von der vlrusreplikation abhangigen Variation unteriiegen, und die infblgedessen in denjenigen Zel- 
len, in denen sich das HCV bzw. das HCV-RNA- Konstrukt vermehrt, entweder reprimiert oder aktiviert werden. Das 
heiBt: die Reduktion bzw. Aktivierung dieser Funktion ist ein Ersatzmarker fur die vlrusreplikation bzw. die Replikation 
des HCV-RNA-Konstrukts. 

35 [0031] Die Positionen von Reportergen und selektierbarem Markergen (Selektionsgen) kOnnen so gewahlt sein, 
daB ein aus den beiden Genprodukten gebildetes Fusionsprotein exprimiert wird. Hierbei besteht die vorteilhafte M6g- 
iichkert, daB diese beiden Gene so in dem HCV-RNA-Kbnstrukt angeordnet sind, daB ihre beiden exprimierten Proteine 
zunachst uber eine Schnittstelle fur eine Protease (z.B. Ubiquitin) oder uber ein selbstspaltendes Peptid (z.B. das 2A- 
Protein der Picornaviren) fusioniert sind und erst spater proteolytisch wieder getrennt werden. 

40 Ebensogut kOnnen diese beiden Positionen aber auch derart getrennt voneinander liegen, daB beide Genprodukte 
separat exprimiert werden. (z.B. in der Reihenfolge: Marker- bzw. Resistenzgen — interne Ribosomenbindungsstelle 
— Reportergen). 

Im Fall des Reportergens hat sich eine Ausfuhrungsvariante besonders bewahrt, bei der das Reportergen in das offene 
Leseraster des HCV-Genoms oder -Subgenoms einWoniert ist, und zwar derart, daB es erst nach einer proteolytischen 
45 Prozessierung in eine aktive Form uberfuhrt wird. 

[0032] Das erfindungsgemaBe Zellkultursystem in alien seinen Variationen kann fur vielfattige Zwecke eingesetzt 
werden. Diese umfassen: 

• Das Auffinden antiviral wirksamer Substanzen. Dies k6nnen beispielsweise sein: organ ische Verbindungen, die 
so unmittelbar oder mittelbar in die Vlrusvermehrung eingreifen (z.B. Inhibitoren der viralen Proteasen, der NS3-Heli- 
kase, der NS5B RNA-abhangigen RNA Polymerase), antisense Oligonukleotide, die an eine beliebige Zielsequenz 
innerhalb des HCV-RNA-Kbnstrukts (z.B. die 5' NTR) hybridisieren und unmittelbar oder mittelbar zu einer Beein- 
flussung der Virusvermehrung fuhren z.B. auf Grund einer Reduktion der Translation des HCV-Polyproteins oder 
Ribozyme, die eine beliebige HCV-RNA-Sequenz spalten und damit die vlrusreplikation beeintrachtigen. 
55 • Die Evaluierung jeglicher Art antiviral wirksamer Substanzen in Zellkultur. Solche Substanzen kOnnen beispiels- 
weise mittels 'rational drug design* oder Tiigh-throughput screening' am isolierten gereinigten Enzym gefunden 
werden. Unter Evaluierung sind vor allem die Bestimmung der inhibitorischen Eigenschaften der entsprechenden 
Substanz sowie deren Wirkungsmechanismus zu verstehen. 
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Die Identifikation neuer Angriffsziele, viralen oder zellularen Ursprungs, fur eine HCV-spezifische antivirale Thera- 
pie. 1st beispielsweise ein zelluiares Protein essentieil fQr die Virusreplikation, kann mittels Hemmung dieses zellu- 
laren Proteins die Virusreplikation ebenfalls beeinfluBt werden. Das Auffinden solcher auxiliaren Faktoren ist mit 
dem erf indungsgemaBen System ebenfalls moglich. 

5 • Der Einsatz fQr die Resistenzbestimmung. Es ist anzunehmen, daB auf Grund der hohen Mutationsrate des HCV- 
Genoms Therapieresistenzen auftreten. Solche Resistenzen, die gerade bei der Winischen Zulassung einer Sub- 
stanz von groBer Bedeutung sind. lassen sich mit dem erf indungsgemaBen Zellkultursystem ermitteln. Zellinien in 
denen sich das HCV-RNA-Konstrukt bzw. das HCV-Genom oder - Subgenom repliziert werden mit steigenden 
Konzentrationen der entsprechenden Substanz inkubiert und die Replikation der viralen RNA wird entweder 

io anhand eines eingebrachten Reporters oder durch qualitative oder quantitative Bestimmung der viralen NuHein- 
sauren oder Proteine bestimmt Resistenz ist dann gegeben, wenn bei normaler Wirkstoffkonzentration keine 
Hemmung der Replikation zu beobachten ist. Durch ReWonierung der HCV-RNA (z.B. mittels RT-PCR) und 
Sequenzanalyse konnen die fQr Therapieresistenz verantwortlichen NuWeotid- bzw. Aminosaureaustausche ermrt- 
telt werden. Durch Einkfonieren der/des entsprechenden Austausche/s in das Ursprungskonstrukt kann deren 

is Kausalitat fur die Therapieresistenz bewiesen werden. 

Die Produktion von authentischen Virusproteinen (Arrtigene) f Or die EntwicWung und/oder Evaluierung von Diagno- 
stika. Das erfindungsgemaBe Zellkultursystem erlaubt auch die Expression von HCV-Antigenen in Zellkulturen. 
Diese Arrtigene kOnnen prinzipiell auch fur den Aufbau diagnostischer Nachweisverfahren eingesetzt werden. 
Die Produktion von HCV Wen und virus-ahnlichen Partikeln insbesondere zur EntwicWung oder Herstellung von 

20 Therapeutika und Impfstoffen sowie fur diagnostische Zwecke. Insbesondere zellkultur-adaptierte vollstandige 
HCV-Genome, die mit dem erfindungsgemaBen Zellkultursystem hergestellt werden konnen, sind in der Lage, mit 
hoher Effizienz in Zellkulturen zu repiizieren. Diese Genome besitzen alle Funktionen des HCV und sind deshalb 
in der Lage infektiose Viren zu produzieren. 

25 [0033] Das erfindungsgemaBe HCV-RNA-Kbnstrukt fur sich genommen kann in alien seinen Variationen ebenfalls 
fur vielfartige Zwecke eingesetzt werden. Dazu gehGren vor allem: 

• Die Kbnstruktion attenuierter Hepatitis C Viren bzw. HCV-ahnlicher Partikel und deren Produktion in Zellkulturen: 
Durch zufallige oder gezieft hervorgerufene Mutationen, beispielsweise Punktrnutationen, Deletionen oder Insertio- 

30 nen, konnen attenuierte HCV- oder HCV-ahnliche Partikel erzeugt werden, d.h. Viren bzw. virusahnliche Partikel 
mit voller Replikationskompetenz aber verringerter bzw. fehlender Pathogenitat Solche attenuierte HCV- oder 
HCV-ahnliche Partikel sind insbesondere als Impfstoff einsetzbar. 

• Die Konstruktion von HCV-RNA-Kbnstrukten mit integrierten Fremdgenen, beispielsweise zur Verwendung als 
leberzellspezrf ische Genfahren in der Gentherapie. Auf Grund des ausgepragten Leberzelrtropismus des HCV und 

35 der Moglichkeit, Teile des Genoms durch heterologe Sequenzen zu ersetzen. lassen sich HCV-RNA-Kbnstrukte 
herstellen, bei denen beispielsweise die Strukturproteine durch ein therapeutisch wirksames Gen ersetzt werden. 
Das so erhartene HCV-RNA-Konstrukt wird in Zellen eingeschleust. vorzugsweise mittels Transfektion, die die feh- 
lenden HCV-FunkrJonen, beispielsweise die Struturproteine, konstitutrv oder induzierbar exprimieren. Durch diese 
dem Fachmann unter dem Begriff der ^^^[^1611^13110^ bekanrrte Technik lassen sich Viruspartikel erzeu- 

40 gen, in die das HCV-RNA-Kbnstrukt eingebaut wird. Die so erhaltenen Partikel kOnnen fur die Infektion vorzugs- 
weise von Leberzellen verwendet werden. In diesen wird das therapeutisch wirksame Fremdgen zur Expression 
gebracht und entfartet damit seine therapeutische Wirkung. 

• Das Auffinden permissiver Zellen, d.h. Zellen, in denen eine produktive Virusvermehrung erfolgt. Zu diesem Zweck 
wird entweder eines der vorgenannten HCV-RNA-Genomkonstrukte verwendet das zur Bildung kompletter infek- 

45 tioser Viren befahigt ist, oder es wird eines der vorgenannten HCV-Subgenom-Konstrukte eingesetzt, das aller- 
dings zunachst gemSB vorgenanntem Beispiel in eine Zellinie transfiziert wird, die die fehlenden Funktionen 
konstitutiv Oder induzierbar exprimiert. In all diesen Fallen errtstehen Viruspartikel, die zusatzlich zur HCV- 
Sequenz ein Resistenz- und/oder Reportergen tragen. Zum Auffinden von Zellen, in denen das HCV repiizieren 
kann, werden diese Zellen mit den so hergestellten Viren infiziert und einer Antibiotikumselektion unterzogen oder, 

so in Abhangigkeit vom HCV-RNA-Konstrukt, mittels Nachweis der Expression des Reportergens urrtersucht Da eine 
Antibiotikumresistenz bzw. eine Expression des Reportergens nur dann nachweisbar ist, wenn das HCV-RNA-Kon- 
strukt repliziert, mussen die so gefundenen Zellen permissrv sein. Auf diese Weise lassen sich nahezu beliebige 
Zellinien oder primare Zellkulturen hinsichtlich der Permissivrtat testen und auffinden. 

55 [0034] Das erfindungsgemaBe Zellkultursystem erlaubt auch das gezielte Auffinden von HCV-RNA-Kbnstrukten, 
bei denen es auf Grund von Mutationen, die sich entweder zufailig im Rahmen der HCV- RNA- Replikation ereignen 
oder die gezielt in das Kbnstrukt eingefuhrt werden, zu einer Steigerung der Replikationseffizienz kommt Solche Muta- 
tionen, die zu einer Veranderung der Replikation des HCV-RNA-Konstrukts fuhren, sind dem Fachmann als adaptive 
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Mutationen bekannt Die Erfindung urrrtaBt deshalb auch Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten 
eines erfindungsgemaBen HCV-RNA-Kbnstrukts gemaB vorstehender Beschreibung, wobei die Mutanten gegenOber 
dem originaren HCV-RNA-Konstrukt eine erhohte Replikationseffizienz aufweisen. Sie umfaBt desweiteren ein Verfah- 
ren zur Herstellung von Mutanten eines HCV-RNA-Votlangengenoms Oder eines HCV-RNA-Teilgenoms Oder eines 
5 beliebigen HCV-RNA-Kbnstrukts mit im Vergleich zu dem ursprOnglichen HCV-RNA-Vollangengenom Oder -Teilgenom 
oder HCV-RNA-Kbnstrukt erhGhter Replikationseffizienz, sowie zellkultur-adaptierte Mutanten von HCV-RNA-Kon- 
strukten. HCV-Vollangengenomen und HCV-Teilgenomen mit im Vergleich zu den ursprunglichen Konstrukten, Teil- 
oder Voliangengenomen erhGhter Replikationseffizienz. 

[0035] Das erfindungsgemaBe Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten eines erfindungs- 
w gemaBen HCV-RNA-Konstrukts. wobei die Mutanten gegenOber dem HCV-RNA-Konstrukt eine erhChte Replikations- 
effizienz aufweisen, ist dadurch gekennzeichnet, daB man ein Zellkultursystem gemaB Anspruch 1, bei dem das 
eingeschleuste HCV-spezif ische Genmaterial ein HCV-RNA-Konstrukt mit Selektionsgen nach einem der AnsprOche 4 
bis 19 ist, auf/in dem dem Selektionsgen entsprechenden Selektionsmedium kultiviert, daB man die gewachsenen Zell- 
Wone erntet und daB man aus diesen ZellWonen die HCV-RNA-Konstrukte isoliert. 
15 [0036] Bei einer vorteilhaften Weiterbildung dieses Herstellungsverfahrens werden die tsolierten HCV-RNA-Kon- 
strukte wenigstens einmal erneut passagiert, namlich in Zellen eines Zellkultursystems nach Anspruch 1 einge- 
schleust, das dabet erhaltene Zellkultursystem gemaB Anspruch 1 . bei dem das eingeschleuste HCV-spezifische 
Genmaterial das isolierte HCV-RNA-Kbnstrukt mit Selektionsgen ist auf/in dem dem Selektionsgen entsprechenden 
Selektionsmedium kultiviert, die gewachsenen ZellWone geerntet und daraus die HCV-RNA-Konstrukte isoliert 
20 Mit dieser Verfahrensvariante kann der Grad der adaptiven Mutationen und damit der Grad der Replikationseffizienz in 
den betreffenden HCV-RNA-Konstrukten noch gesteigert werden. 

[0037] Das erfindungsgemaBe Verfahren zur Herstellung von Mutanten eines HCV - Vollangengenoms oder eines 
HCV- Teilgenoms oder eines beliebigen HCV-RNA-Konstrukts mit im Vergleich zu dem ursprunglichen HCV- Vollangen- 
genom oder - Teilgenom oder HCV-RNA-Konstrukt erhOhter Replikationseffizienz zeichnet sich dadurch aus. daB man 

25 mit Hilfe eines der beiden vorstehend genannten Herstellungsverfahren eine zellkultur-adaptierte Mutarrte eines HCV- 
RNA-Kbnstrukts herstellt diese aus den Zellen isoliert mit im Stand der Technik bekannten Methoden Woniert und 
sequenziert und durch Vergleich mit der NuWeotid- und Aminosauresequenz des ursprOnglichen HCV-RNA-Kbnstrukts 
die Art. Anzahl und Positionen der Mutationen bestimmt, und diese Mutationen dann entweder durch gezielte Mutage- 
nese oder durch Austausch von Sequenzabschnitten, welche die betreffenden Mutationen enthalten, in ein (isoliertes) 

30 HCV-Vollangen- oder -teilgenom oder ein beliebiges HCV-RNA-Kbnstrukt einfuhrt 

Zum Nachweis bzw. zur Verif izierung derjenigen Mutationen, die tatsachlich eine Veranderung der Replikation und ins- 
besondere eine Replikationssteigerung bewirken, kann ein Test durchgefuhrt werden, bei dem die bestimmten NuWeo- 
tid- und/oder Aminosaureaustausche in das ursprOngliche HCV-RNA-Kbnstrukt eingefuhrt und dieses wiederum in 
Zellkultur eingeschleust wird. Wenn die eingefuhrte Mutation tatsachlich zu einer Steigerung der Replikation fQhrt, 

35 sollte im Fall eines HCV-RNA-Konstrukts mit selektierbarem Markergen die Zahl der resistenten ZellWone bei dem 
kunstlich mutierten Konstrukt deutlich h6her sein als bei dem unbehandelten Konstrukt Im Fall eines Konstrukts mit 
einem Reportergen sollte die Aktivitat bzw. Menge des Reporters bei dem kunstlich mutierten Konstrukt deutlich hoher 
sein als bei dem unbehandelten. 

[0038] Die erfindungsgemaBen zellkultur-adaptierten HCV-RNA-Konstrukte mit hoher Replikationseffizienz sind 
40 dadurch gekennzeichnet, daB sie durch NuWeotid- und/oder Aminosaureaustausche von einem HCV-RNA-Konstrukt 
nach einem der AnsprOche 4 bis 19 ableitbar sind und daB sie mit einem der beiden vorstehend genannten Herstel- 
lungsverfahren erhaWich sind. 

[0039] Diese zellkultur-adaptierten HCV-RNA-Konstrukte konnen dazu verwendet werden, beliebige HCV-RNA- 
Konstrukte oder HCV-Vollangen- oder Teilgenome mit erhohter Replikationseffizienz herzustellen. Dabei konnen 
45 sowohl Kbnstrukte mit einem selektierbaren Resistenzgen als auch Konstrukte ohne ein solches bzw. mit einem nicht- 
selektierbaren Reportergen (z.B. Luziferase) hergestellt werden, denn aufgrund der sehr hohen Replikationseffizienz 
des zellkultur-adaptierten HCV-RNA-Konstrukts kann dessen Replikation auch in nicht-selektionierten Zellen nachge- 
wiesen werden. 

Die erfindungsgemaBen zellkultur-adaptierten Mutanten eines HCV-RNA-Konstrukts oder eines HCV-Vollangenge- 
so noms oder eines HCV-Teilgenoms mit im Vergleich zu dem ursprOnglichen HCV-RNA-Kbnstrukt oder dem ursprOngli- 
chen HCV-Vollangengenom erhohter Replikationseffizienz , sind dadurch charaklerisiert, daB sie mit einem Verfahren 
erhaltiich sind, bei dem man in einem zellkultur-adaptierten HCV-RNA-Konstrukt durch Sequenzanalyse und Sequenz- 
vergleich die Art und Anzahl der Mutationen bestimmt und diese Mutationen in ein HCV-RNA-Konstrukt, insbesondere 
in ein HCV-RNA-Konstrukt gemaB einem der AnsprOche 4 bis 19, oder in ein (isoliertes) HCV-RNA-Vollangengenom 
55 einfuhrt, entweder durch gezielte Mutagenese oder durch Austausch von Sequenzabschnitten, die die betreffenden 
Mutationen enthalten. 

[0040] Eine Gruppe ganz bevorzugter HCV-RNA-Konstrukte, HCV-Vollangengenome und HCV-Teilgenomen mit 
hoher und sehr hoher Replikationseffizienz und infolgedessen sehr guter Eignung fur die praktische Anwendung ist 
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dadurch gekennzeichnet, daB sie einen Oder mehrere Oder alle der in Tabelle 3 aufgelisteten Aminosaure- bzw. Nukleo- 
tidaustausche und/oder einen Oder mehrere der folgenden Aminosaureaustausche aufweist: 1283 arg -> gly , 1383 glu 
-> ala , 1577 lys -> arg , 1609 lys -> glu , 1936 pro -> ser , 2163 glu -> gly , 2330 lys -> glu . 2442 ile -> val. (Die Zahlen 
beziehen sich auf die Aminosaureposrtionen des Potyproteins des HCV-lsolats con1 , siehe Tabelle 1). 

5 

Besondere Eigenschaften der In den Sequenzprotokollen angegebenen Sequenzen: 

SEQ ID-NO: 1 

10 [0041] 

Name: l389/Core-3Ywt 
Aufbau (NuWeotidpositionen): 

is 1.1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

20 4. 1813-1 0842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051 -4239: Protein p7 

25 9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

1 1 . 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

1 3. 7729-9069: Nichtstrukturprotein 5A (NS5A) 
30 14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

15. 10846-1 1076: HCV 3 ? nicht-translatierte Region 

SEQ ID-NO: 2 

35 [0042] 

Name: l337/NS2-3Ywt 
Aufbau (NuWeotidpositionen): 

40 1.1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1181: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1190-1800: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

45 

4. 1801-8403: HCV Polyprotein von Nichtstrukturprotein 2 bis Nichtstrukturprotein 5B 

5. 1801-2451: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

6. 2452-4344: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

7. 4345-4506: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 
so 8. 4507-5289: Nichtstrukturprotein 4B (NS4B) 

9. 5290-6630: Nichtstrukturprotein 5A (NS5A) 

10. 6631-8403: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 
1 1 . 8407-8637: HCV 3' nicht-translatierte Region 
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SEQID-NO:3 
[0043] 

s Name: l389/NS3-3Vwt 

Aufbau (NuWeotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
io 3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein SB 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
is 6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

1 0. 7771 -8001 : HCV 3* nicht-translatierte Region 

20 

SEQID-N0:4 
[0044] 

25 Name: I337/NS3-37wt 

Aulbau (NuWeotidpositionen): 

1 . 1 -341 : HCV 5* nicht-translatierte Region 

2. 342-1 181 : HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein: selektionierbarer Marker 
30 3. 1 190-1800: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden HCV offenen Leserasters 

4. 1801-7758: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B 

5. 1801-3696: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
35 6. 3697-3858: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfektor 

7. 3859-4641: Nichtstrukturprotein 4B (NS4B) 

8. 4642-5982: Nichtstrukturprotein 5A (NS5A) 

9. 5983-7755: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

10. 7759-7989: HCV 3' nicht-translatierte Region 

40 

SEQ ID-NO: 5 
[0045] 

45 Name: l389/NS2-37wt 

Aufbau (NuWeotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

so 3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden HCV offenen Leserasters 

4. 1813-8418: HCV Polyprotein von Nichtstrukturprotein 2 bis Nichtstrukturprotein 5B 

5. 1813-2463: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 
55 6. 2464-4356: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

7. 4357-4518: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 

8. 4519-5301 : Nichtstrukturprotein 4B (NS4B) 

9. 5302-6642: Nichtstrukturprotein 5A (NS5A) 
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10. 6643-8415: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

11. 8419-8649: HCV 3* nicht-translatierte Region 

SEQ ID-NO: 6 

5 

[0046] 

Name: l389/NS3-3'/9-13F 
Aufbau (NuWeotidpositionen): 

10 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; eriaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

T5 4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 

ten Mutante9-13F 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 
20 7. 3871 -4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 

25 SEQ ID-NO: 7 

[0047] 

Name: !389/Core-379-13F 
30 Aulbau (NuWeotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; eriaubt die Translation des 
35 dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutarrte 9-13F 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: Hullprotein 1 (envelope protein 1); Strukturprotein 
40 7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

1 1 . 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 
45 1 2. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 
15. 10846-11076: HCV 3' nicht-translatierte Region 

so SEQ ID-NO: 8 

[0048] 

Name: I389/NS3-3V5.1 
55 Aufbau (NuWeotidpositionen): 

1. 1-341: HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 



11 



EP 1 043 399 A2 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubtdie Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
ten Mutante5.1 

5. 1 81 3-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5B (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 7771-8001: HCV 3* 
nicht-translatierte Region 

SEQ ID-NO: 9 

is [0049] 

Name: l389/Core-375. 1 
Aufbau (NuMeotidpositionen): 

1. 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkurtur-adaptierten Mutarrte 5.1 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961 : Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891 -6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

1 1. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 
12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Poiymerase 
15. 10846-1 1076: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 10 

40 [0050] 

Name: I389/NS3-3V19 
Aufbau (NuMeotidpositionen): 

45 1.1 -341 : HCV 5* nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
50 ten Mutarrte 19 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 
55 8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 
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SEQ ID-NO: 11 
[0051] 

s Name: l389/Core-3719 

Aufbau (NuWeotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
io 3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 19 

5. 1813-2385: HCV Core Protein; Strukturprotein 
15 6. 2386-2961 : HQIIprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: HQIIprotein 2 (envelope protein 2); Strukturprotein 

8. 4051 -4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
20 11. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 
15. 10846-11076: HCV 3* nicht-translatierte Region 



25 



[0052] Die Erfindung wind im fblgenden anhand von Ausf uhrungsbeispielen und dazugehdrigen Tabellen und Figu- 
ren naher eriautert. Die erwahnten Figuren zeigen 



Rg. 1 A: Die Struktur eines erfindungsgemaBen HCV-RNA-Konstrukts Ganz oben ist eine schematische Darstel- 
30 lung der Struktur des kompletten parentalen HCV-Genoms gegeben mit den Positionen der Gene fur die 

Spaltungsprodukte core, E1 , E2, p7, NS2, NS3, NS4A, NS4B, NS5A und NS5B innerhalb des Polypro- 
teins, und den 5' und 3' nichttranslatierten Regionen (5' NTR und 3' NTR) — als Horizontalbalken darge- 
stellt — , und mit den beiden fur die Erzeugung der Subgenom-Kbnstrukte ausgewahlten Positionen, 
namlich der Position der 'GDD-katalytischen Domane' der NS5B RNA Polymerase (GDD) und der Posi- 
35 tion der 3' Grenze der HCV-IRES (NuWeotidpositionen 1 bis 377 bzw. 1 bis 389) —oberhalb des Genom- 

schemas eingezeichnet — . Die Zahlen unterhalb des Genomschemas bezeichnen die entsprechenden 
Nukleotidposftionen. 

Darunter sind schematische Darstellungen der Strukturen zweier erfindungsgemaBer, modifizierter 
HCV-RNA-Konstrukte (Subgenom) gezeigt, bestehend aus der 5' HCV-IRES, dem Neomycinphospho- 
40 transferasegen (Neo 0 ), der EMCV-IRES (E-l) und den HCV Sequenzen von NS2 bzw. NS3 bis zum 

autherrtischen 3' Ende. Die Position der das NS5B Polymerase GDD-Motiv umfassenden 10 Aminosau- 
ren-Deletion ist jeweils mit einem Dreieck (A) markiert 

Rg. 1 B: Das Ergebnis einer denaturierenden Formaldehyd-Agarose-Gelelektrophorese zum Nachweis von repli- 
45 zierter Plusstrang-RNA in transfizierten subpassagierten Huh-7 Zellklonen. 

Die Positionen der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angege- 
ben, die Gr66en (Anzahlen der NuWeotide) der RNA-Marker (M) sind links von Spur 1 angegeben. 

Rg. 1 C : Das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum Nachweis der Abwesenheit von 
so integrierter Replikon-DNA in den meisten der seleklierten ZellWone. 

Spuren 1 und 2 zeigen die Posffivkontrollen, Spur 13 die Negativ-Kontrolle. Die Zahlenangaben links der 
Spur 1 bezeichnen die GroBe der NuWeotid-Marker-Molekule. 

Rg. 2 A: Das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum sensitiven AusschluB integrierter 
55 Replikon-DNA (Plasmid Molekule l 377 /NS3-3Ywt) in einem HCV-RNA-Konstrukt-haltigen ZellWon (9-1 3). 

Die Spuren 7 bis 11 reprasentieren das Ergebnis einer Titration von DNA-Molekulen des Konstrukts 
l 3 7 7 /NS3-3'/wt ohne Zugabe von Gesamt-DNA des ZellWons 9-13 und die Spuren 2 - 6 reprasentieren 
die gleichen Plasmidmolekule mit Zugabe von jeweils 1 jig 9-13 DNA vor der PCR (zwecks AusschluB 
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eines Inhibitors der PCR in der DNA-Praparation). Spur 13 reprasentiert die Negativ-Korrtrolle (PCR 
ohne DNA-Sonde). Spur 1 zeigt das Ergebnis, das mit einem ug Gesamt-DNA des Zellkons 9-13 erhal- 
tenwurde. 

5 Rg. 2 B: Das Ergebnis eines Northern-Blot-Tests zur Quantif izierung von HCV Plus- und Minusstrang RNA. 

Die Pfeile markieren die Positionen von Replikon-RNA. Die "plus" und "minus" -Abgaben bezeichnen die 
positive (plus) bzw. negative (minus) Polaritat der RNA-Kbntrollen, die auf das Gel aufgetragen wurden. 
"Minusstrand" und "Plusstrand" bezeichnen die Spezifrtat der radioaktiven RNA-Sonden. 

io Rg. 2 C: Ergebnis einer Formaldehyd-Agarose-Gelelektrophorese nach radioaktiver Markierung der intrazellular 
replizierten HCV- RNA zum Nachweis der Resistenz der HCV-RNA-Replikation gegen Dactinomycin. 

Rg. 3 A: Nachweis von HCV-spezifischen Antigenen in den selektierten ZellWonen mittels Immunoprazipitation 
nach metabolischer Radioaktivmarkierung. Die Spuren 7 - 9 reprasentieren authentische GrOSenmarker 
is (die nach transienter Expression eines HCV-RNA-Konstrukts in Huh-7-Zellen erhalten wurden); iderrtifi- 

zierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Molekulargewichte (in Kilodalton) sind 
am rechten Rand von Spur 9 angegeben. 

Rg. 3 B: Ergebnisse eines Immunf luoreszenztests zum Nachweis der subzellularen Lokalisation von HCV Antige- 
20 nen. 

Rg. 4: Schematische Darstellung der Struktur eines erfindungsgemaBen selekterbaren HCV-RNA-Kbnstrukts 

(komplettes Genom) bestehend aus der 5* HCV-IRES, dem Neomycinphosphotransferasegen (NeoR). 
einem heterologen IRES-Element. z.B. des Encephalomyocarditisvirus (E-l), dem vollstandigen HCV- 
25 Leseraster und der authentischen 3' NTR. 

Rg. 5: Schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Antibiotikumresi- 

stenzgen (A) innerhalb der fQr das Polyprotein kodierenden NuWeotidsequenz (monocistronische RNA), 
und (B) innerhalb der 3' NTR (bicistronische RNA). 

30 

Rg. 6: Schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Reportergen (A) aJs 

Teil eines HCV-Replikons von NS3 bis NS5B; — das Reporterprotein wird letztendlich durch virale Oder 
durch zellulare Proteasen aus dem Polyprotein gespalten und das selektierbare Markergen (Selektions- 
gen) bzw. das Resistenzgen durch Kontransfektion in die Zellen einscNeust , (B) als Teil eines Fusions- 

35 gens aus Resistenz- und Reportergen (z.B. fur die Neomycinphosphotransferase und green fluorescent 

Protein) (C) als Teil eines Replikons aus Resistenz- und Reportergen (z.B. fur die Neomycinphospho- 
transferase und das green fluorescent Protein), die uber eine NuWeotidsequenz verbunden sind, welche 
fur eine Aminosauresequenz kodiert (schraffierter Bereich), die von einer Protease gespalten werden 
kann oder die uber eine selbstspaltende (autokatalytische) Aktivrtat verfugt, (D) als unabhangiges Gen 

40 (hier green fluorescent protein), das von einer eigenen internen Ribosomenbindungsstelle (IRES) aus 

exprimiert wird; — das Resistenzgen (hier: Neomycinphosphotransferase-Gen) wird davon unabhangig 
ebenfalls von einer eigenen internen Ribosomenbindungsstelle (IRES) aus exprimiert (polycistronisches 
Kbnstrukt). 

45 Rg. 7: Schematische Darstellung der Struktur eines HCV-RNA-Kbnstrukts bei dem das Resistenzgen uber ein 

Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. Die dik- 
ken Linien stellen die HCV 5* und 3* NTRs dar, E-l ist eine heterologe interne Ribosomenbindungsstelle, 
die fur die Expression des Resistenzgens notwendig ist, und das graue Quadrat stellt das Ribozym bzw. 
eine Erkennungsstelle fur ein Ribozym dar. 

50 

Rg. 8: Schematische Darstellung der Struktur eines HCV-RNA-Kbnstrukts mit Resistenzgen und integriertem 

Fremdgen. 

Rg. 9: Methodisches Vbrgehen zum Vergleich der spezifischen Infektiositat (ausgedruckt als Anzahl gebildeter 

55 Zellkolonien) von Gesamt-RNA versus in vitro Transkripte. HCV- RNA wird mittels in vitro Transkription 

eines entsprechenden RNA-Konstrukts hergestellt und durch Messung der optischen Dichte bei 260 nm 
(OD 260 nm) quantifiziert Eine definierte Anzahl dieser Molekule wird mit einer bestimmten Menge 
Gesamt-RNA von naTven Huh-7 Zellen gemischt und diese Mischung m'rt Hilfe der Elektroporation in 
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natve Huh-7 Zellen eingeschleust. Parallel dazu wird die Gesamt-RNA eines Zellkions, der mit der in 
Figur 1 beschriebenen Methode hergestellt wurde. mit einem im Stand der Technik bekannten Verfahren 
isoliert und die Menge der darin enthaltenen HCV-RNA mitteJs Northern-blot unter Verwendung einer 
HCV-spezrfischen RNA-Sonde und anschlie Bender Quantifizierung mittels Phosphoimager bestimmt. 
Eine definierte Menge dieser Gesamt-RNA wird analog den in vitro Transkripten in naTve Huh-7 Zellen 
transfiziert Diese Zellen in beiden Ansatzen werden danach einer G418-Selektion unterzogen und die 
Anzahl der gebildeten Kolonien durch Auszahlen nach fixieren und anfarben mit Coomassie-Brilliant- 
Blau bestimmt Zur Bestimmung der Transfektionseffizienz wird jedem Transfektionsansatz 1^g eines 
Plasmids zugesetzt, das die Expression der Luziferase erlaubt Ein Aliquot der transfizierten Zellen wird 
nach 24 Stunden geerntet und die Luziferaseaktivitat im jeweiligen Zellysat bestimmt. Die Anzahl der 
Kolonien wird jeweils auf die Luziferaseexpression normiert. 

Sequenzanalyse der 9-13 Klone. Gesamt-RNA des ZellWons 9-13, der durch Transfektion des HCV- 
RNA- Kbnstrukts I377/NS3-3' entstand, wurde mit einem im Stand der Technik bekannten Verfahren iso- 
liert und das HCV-RNA-Konstrukt von NukJeotidposition 59 bis 9386 mit Hilfe der 'long-distance RT-PCR* 
unter Verwendung der primer S59 und A9413 amplizifiert. Die PCR-Fragmerrte wurden Woniert und 1 1 
Klone (genannt 9-13 A - K) vollstandig sequenziert wobei sich die Klone D und I. E und G sowie H und 
J als identisch erwiesen. Die Position en der Aminosaureunterschiede in der NS3-5B Region zwischen 
den reWonierten HCV-RNAs und dem parentalen Kbnstrukt sind mit einem dicken vertikalen Strich beim 
jeweiligen Won markiert. Jeder Klon wurde mit dem Restriktionsenzym Sfi 1 verdaut und das jeweilige 
Fragment in das parentale Kbnstrukt inseriert. Diese Klone wurden jeweils in Huh-7 Zellen transfiziert 
und die Zellen wie in Rgur 1 beschrieben einer Selektion unterzogen. Die Anzahl der mit jedem Kon- 
strukt erhaltenen ZellWone ist rechts neben dem jeweiligen Konstrukt vermerkt. 

Prinzip der Replikationsbestimmung mrt Hilfe eines Reportergens. Im oberen Teil der Figur ist das HCV- 
DNA- Konstrukt Issg/Luc/NSS-S' dargestellt, bestehend aus der HCV 5' NTR (NukJeotidposition 1-389), 
dem Luziferasegen (Ave), der IRES des Encephalomyocarditis Virus, dem HCV NS3-5B und der 3' NTR. 
Die Position des aktiven Zentrums der NS5B RN A- Polymerase, in das ein inaktivierender Aminosaure- 
austausch eingefOhrt wurde, ist mit *GND' angedeutet. Die Plasmide. die fur das replikationskompetente 
bzw. das defekte HCV-RNA-Konstrukt kodieren, werden mit dem Restriktionsenzym Sea I verdaut und 
in eine in vitro Transkription mit der T7 RNA-Polymerase eingesetzt. Nach Entfernung der Matrizen-DNA 
werden die jeweiligen HCV-RNA-Konstrukte mittels Elektroporation in naive Huh-7 Zellen eingeschleust 
und diese in regelmaBigen Abstanden geerntet. 

35 Rg. 11 B: Vergleich der Luziferaseaktivrtaten in Zellen transfiziert mit dem parentalen HCV-RNA-Konstrukt 
l 38 9/Luc/NS3-37wt (wt) Oder den folgenden Varianten: Der inaktiven RNA (318 DN), der Variante 9-13F 
Oder der Variante 5.1. Die Zellen wurden 6 (nicht gezeigt), 24, 48, 72, 96, 120, 144 und 168 Stunden 
nach der Transfektion geerntet und die Luziferaseaktrvitaten luminometrisch bestimmt 

40 Rg. 12: Selektionierbare HCV-Vollangengenome (Konstrukte l 38 9/core-375.1 und l 389 /core-379-13F). 

(A) Schematische Darstellung des Vollangenkonstrukts. Der Bereich zwischen den beiden ange- 
deuteten Erkennungsstellen fur das Restriktionsenzym Sfi I entspricht den Sequenzen der hoch- 
adaptierten RNA-Varianten 5.1. Oder 9-1 3F. 

(B) Anzahl der Kolonien die nach Transfektion von jeweils 0,1 ^ig in vitro transkribierter RNA der 
unter A dargestellten Konstrukte l 38 9/core-3V5.1 in HUH7-Zellen erhalten wurden. Angegeben ist 
das Ergebnis eines reprasentativen Experimentes. 

(C) Nachweis autonom replizierender HCV-Vollangen-RNAs in G418-resistenten ZellWonen, die 
nach Transfektion des entsprechenden in vitro Transkripts erhalten wurden. Die AbbikJung zeigt das 
Autoradiogramm eines Northern Blots, der mit einer Sonde gegen das neo-Resistenzgen und der 
HCV 5* NTR hybridisiert wurde. Die in Spur 1 und 2 dargestellten Kontrollen entsprechen jeweils 10 8 
Molekulen der angegebenen in vitro Transkripte, gemischt mit Gesamt-RNA aus na'rven Huh-7 Zel- 
len. Die Negatfvkontrolle enthalt ausschlieBfich Gesamt RNA aus na'rven Huh-7 Zellen (Spur 3). Die 
Spuren 4-9 enthalten 3-10 p.g Gesamt-RNA aus G418-resistenten ZellWonen, die nach Transfektion 
von in vitro transkribierter l 38 9/core-3V5.1-RNA bzw. l 389 /core-3'/9-13F-RNA erhalten wurden. Die 
for die Selektion verwendete G41 8-Konzentration ist jeweils angegeben. Funf der dargestellten Zell- 
Wone enthalten die hoch adaptierte RNA-Variante 5.1 (Spur 4-8), einer die adaptierte RNA- Variante 
9-13F(Spur9). 
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Fig. 13: HCV-RNA-Konstrukte mit einem Reportergen. (A) Bicistronische HCV-RNA-Kbnstrukte. Das Reporter- 
gen wind mit Hilfe einer separaten IRES translatiert (B) Monocistronische HCV-RNA-Konstrukte. Das 
Reportergenprodukt wind als Fusionsprotein mit einem HCV-Protein exprimiert Die beiden Anteiie sind 
uber eine Erkennungssequenz fOr eine virale Oder zellulare Protease verbunden, die eine proteolytische 
Trennung der beiden f usionierten Proteinanteile erlaubt. Im gezeigten Beispiel wurden das Reportergen- 
produkt und das jeweilige HCV-Protein uber eine Erkennungssequenz fOr Ubiqurtin (Ub) fusioniert. 

Rg. 14: Tricistronisches Vollangen HCV-RNA-Konstrukt, das zusatzlich zum Resistenzgen ein Fremdgen inse- 
riert besfet 



Fig. 15: Monocistronische HCV-RNA-Konstrukte. bei denen das Resistenzgenprodukt als Fusionsprotein mit 
dem HCV-Anteil exprimiert wird. Das Resistenzgen (RG) ist entweder als Fusionsprotein aktiv oder es 
wird so mit einer proteolytisch spattbaren Sequenz mit dem HCV-Anteil fusioniert, daB das Resistenz- 
genprodukt durch eine zellulare oder virale Protease vom HCV-Anteil abgespalten wird. Im gezeigten 
is Beispiel wurde das Resistenzgen Qber die fOr Ubiquitin (Ub) kodierende Sequenz mit dem jeweiligen 

HCV-Anteil fusioniert 

Beispiel 1 : Hersteilung von HCV-RNA-Konstrukten 

20 (A) Svnthese und Klonieruno eines vollstandiaen HCV-Konsensusaenoms mittels RT- PCR 

[0053] Aus der Leber eines chronisch inf izierten Patienten wurde das HCV-Genom, d.h. die HCV-RNA wie nachfol- 
gend beschrieben isoliert: 

[0054] Aus ca. 1 00 mg Leber wurde die tempi ette RNA gemaB dem Verfahren von Chomczynski und Sacci (1 987. 

25 Anal. Biochem. 162. 156) isoliert Mit 1 \iq dieser isolierten RNA wurde eine reverse Trartskription mit den Primern 
A6103 (GCTATCAGCCGGTTCATCCACTGC) oder A9413 (CAGGATGGCCTATTGG CCTGGAG) und dem 'expand 
reverse transcriptase'- System (Boehringer Mannheim, Deutschland) nach den Vorschriften des Herstellers durchge- 
fOhrt. Mit den Produkten dieser reversen Transkription (RT) wurde eine Polymerase-Kettenreaktion (PCR=polymerase 
chain reaction) durchgefuhrt, und zwar unter Verwendung des 'expand long template'-Systems (Boehringer Mannheim. 

30 Deutschland), wobei der Puffer mit 2% Dimethyisulfaxid-Gehalt eingesetzt wurde. Nach einer Stunde bei 42°C wurde 
1/8 dieses Reaktionsansatzes in einem ersten PCR-Durchgang mit den Primern A6103 und S59 (TGTCTTCACGCA- 
GAAAGCGTCTAG) oder A9413 und S4542 (GATGAGCT CGCCGCGAAGCTGTCC) eingesetzt. Nach 40 ZyWen 
wurde 1/10 dieses Reaktionsansatzes in einem zweiten PCR-Durchgang mit den Primern S59 und A4919 (AGCACA- 
GCCCGCGTCATAGCACTCG) Oder S4542 und A9386 (TTAGCTCCCCG TTCATCGGTTGG) eingesetzt. Nach 30 

35 ZyWen wurden die PCR-Produkte mittels praparativer Agarose-Gel-Elektrophorese gereinigt und die dabei eluierten 
Fragmente wurden in den Vektor pCR2.1 (Invitrogen) oder pBSK II (Stratagene) ligiert Vier Klone von jedem Fragment 
wurden analysiert und sequenziert. und es wurde eine Konsensus-Sequenz ermittelt Zu diesem Zweck wurden die 
DNA-Sequenzen miteinander verglichen. Die Positionen, an denen sich die Sequenz eines der Fragmente von den 
Obrigen urrterschied, wurde als unerwunschte Mutation betrachtet. Im Fall von Mehrdeutigkeiten der Sequenz wurden 

40 kurzere sich Qberlappende PCR-Fragmente der betreffenden Region amplifiziert und mehrere Klone sequenziert Auf 
diese Weise konnten zahlreiche potentieile Mutationen in jedem Fragment identrfiziert und somit eine isolat-spezifische 
Konsensussequenz etabliert werden. Diese etablierte Kbnsensussequenz bzw. dieses Genom gehSrt zum weltweit 
verbreiteten Genotyp 1b. Die nicht translatierte Region am 3-Ende (=3' NTR) wurde mittels konventioneller PCR erhal- 
ten, wobei ein Antisense-Primer eingesetzt wurde. der die letzten 24 NuWeotide des im Stand der Technik bekannten 

45 'X-tails' (Tanaka et al., 1995. Biochem. Biophys. Res. Commun. 215. 744; und Rice. PCT7US 96/14033) abdeckt Die 
authentische nicht translatierte Region am S'-Ende (=5' NTR) strangabwarts vom T7 Promoter wurde mittels PCR 
erzeugt, wobei zum einen ein OHgonuWeotid verwendet wurde. das einem verkOrzten T7 Promotor (TAA TAC GAC TCA 
CTA TAG) und den ersten 88 NuWeotiden von HCV entspricht. und zum anderen eines der vorgenannten Plasmide ein- 
gesetzt wurde, das eines der 5* Fragmente des Genoms tragt Aus den subgenomischen Fragmenten mit der gering- 

so sten Anzahl an Nicht-Konsensus-Austauschen wurde ein komplettes HCV-Kbnsensusgenom zusammengesetzt und in 
einen modif izierten pBR322-Vektor insertiert. Abweichungen von der Kbnsensussequenz wurden mittels ortsgerichte- 
ter Mutagenese ("site-directed mutagenesis) beseitigt Urn "run-off-Transkripte mit einem authentischen 3' Ende her- 
zustellen, wurde die 3*-NTR der Isolate (mit dem Ende TGT) zu AGT modrfiziert (gemaB der Sequenz vom Genotyp 3 
= hOon *WS' nach Kolykhalov et al., 1996, J. Virol. 70, 3363) und auBerdem wurde ein zusatzlicher NuWeotidaustausch 

55 an Position 9562 vorgenommen. urn die AT Basenpaarung in der Haarnadelstruktur am 3* Ende der 3' NTR (Kolyhalov 
et al. ibid.) beizubehalten. Urn eine interne Restriktionsstelle for das Enzym Seal zu beseitigen, wurde ferner ein sog. 
stiller ("silent") NuWeotidaustausch vorgenommen. Nach dem Zusammenfugen des Vollangen-Genoms mit passenden 
5'- und 3* NTRen wurde die komplette HCV-Sequenz uberpruft. Dabei wurde kein ungewQnschter NuWeotidaustausch 
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gefunden. 

[0055] Das auf diese Weise hergestellte HCV-Genom sollte per Definition hepatotrop sein. 
(B) Svnthese selektierbarer HCV-Suboenom-Konstrukte 

5 

[0056] Unter Verwendung des unter (A) beschriebenen Konsensusgenoms wurden HCV-Subgenom-Kbnstrukte 
hergestellt, die das Antibiotikumresistenzgen Neomycin-Phosphotransferase (NPT) und zwei Sequenzen von internen 
Ribosomenbindungsstellen (IRES) enthalten. Die hierf Qr angewendeten biochemischen Verfahrenstechniken sind dem 
Fachmann bekannt und gelaufig (siehe: Sambrook, J., E.F. Fritsch, T. Maniatis, 1989, Molecularcloning: a laboratory 

io manual, 2nd ed., Cold Spring Harbour Laboratory, Cold Spring Harbor, N.Y; Ausubel et al. (eds.). 1994, Current Proto- 
cols in Molecular Biology, Vol. 1 -3, John Wiley & Sons Inc.. New York). Das Antibiotikumresistenzgen wurde unmittelbar 
hinter der 5' NTR insertiert, wodurch eine bicistronische RNA erhalten wurde (siehe Rg. 1 A). Ebensogut kann das Anti- 
biotikumresistenzgen aber auch an anderer Stelle des HCV-Subgenom-Kbnstrukts insertiert werden. beispielsweise 
innerhalb der fOr das Polyprotein kodierenden NuWeotidsequenz, wodurch eine monocistronische RNA erhalten wird 

is (siehe Rg. 5 A) oder in die 3' NTR (siehe Rg. 5 B). Bei den IRES-Elementen handelt es sich zum einen um eine der 
beiden HCV-IRES-Varianten Nukleotide 1-377 oder NuWeotide 1-389, und zum anderen um die IRES des Enzephalo- 
myocarditis Virus, die die Translation der HCV Sequenz strangabwarts von den Genen fur NS2 oder NS3 bis zu dem 
authentischen 3' Ende des Genoms steuert. 

[0057] Die beiden genannten HCV-I RES-Varianten wurden wie folgt ermittelt: Auf der Basis von Deletionsanalysen 

20 der 3 f Grenze der HCV-IRES (Reynolds et al. 1995. EMBO J. 14, 6010) wurden verschiedene Abschnitte der 5' NTR 
mit dem NPT Gen fusioniert und anhand von Kbtransfektionen mit einem das T7 RNA Polymerase Gen enthaltenden 
Plasmid hinsichtlich der maximal en Anzahl gebildeter Kolonien analysiert. Die besten Ergebnisse wurden mit den HCV 
Sequenzen von 1-377 und 1-389 erhalten. Da sich das AUG-Startkodon des HCV Polyproteins an Position 342 befindet 
und somit in der IRES-Sequenz enthalten ist kommt es zu einer Fusion von 12 bzw. 16 Aminosauren des HCV-Kap- 

25 sidproteins ("Core-ProteinsT mit der Neomycin Phosphotransferase (siehe Rg. 1 A). 

[0058] Diese modifizierten HCV-Subgenom-Kbnstrukte erhielten dementsprechend die Bezeichnungen l 377 /NS2- 
3' (oder l 377 /NS3-3*) und l 389 /NS2-3* (oder l 389 /NS3-3'). Sie sind in Fig. 1 A schematisch dargestelrt. 
[0059] Mit in-vitro-Transkripten dieser modifizierten parentalen HCV-Subgenom-Konstrukte I377/NS2-3* (oder 
I377/NS3-3') und l 389 /NS2-3' (oder l^g/NSS-S*) wurden verschiedene Zellinien und Primarzellkulturen von menschli- 

30 chen Hepatocyten transfiziert 

[0060] Als parallele Negativ-Kbntrolle zu alien Transfektionsexperimenten wurde zu jedem modifizierten parentalen 
HCV-Subgenom-Kbnstrukt ein entsprechend modifiziertes aber defektes Subgenom konstruiert, das sich von dem par- 
entalen dadurch unterscheidet, daB es innerhalb des Leserasters eine Deletion von 10 Aminosauren aufweist, die das 
aktive Zentrum der NS5B RNA Polymerase umfaBt (Behrens et al., 1996. EMBO J. 15. 12; und Lohmann et al.. 1997, 

35 J. Virol 71. 8416). 

(C\ Svnthese selektierbarer HCV-Genom-Konstrukte 

[0061] Ein NS2-3' Subgenomkonstrukt, das am 5' Ende mit einem Fragment des Luziferasegens und der vollstan- 
40 digen EMCV-IRES verbunden ist, wurde mitNcol und Spel restringiert und mittels praparativer Agarosegelelektropho- 
rese gereinigt Der so erhaltene Vektor wurde in einer 3-Faktor Ligation mit einem NcoI/Notl-HCV-Fragment, 
entsprechend den NuWeotidpositionen 342 bis 1968 des HCV-Genoms und mit einem Notl/Spel-Fragment, entspre- 
chend den NuWeotidpositionen 1968-9605 ligiert. Das entstandene Konstrukt, bei dem das vollstandige HCV-Leser- 
aster und die 3' NTR stromabwarts dem Luziferasegenfragment und der EMCV-IRES liegen, wurde danach mit Pmel 
45 und Spel restringiert und mit dem analog restringierten I^^SS-SVwt-Subgenomkonstrukt- Vektor ligiert. Dieses selek- 
tionierbare HCV-Genomkonstrukt ist in Rg. 4 dargestellt. 

(U\ Herstelluna von den HCV-RNA-Konstrukten entsorechenden in-vitro-Trnaskripten 

50 [0062] Die vorstehend beschriebenen gereinigten Plasmid DNAs wurden mit Seal linearisiert und nach Phe- 
nol/Chloroform-Extraktion und Isopropanol -Prazipitation in eine In-vrtro-Trankriptionsreaktion eingesetzt unter Verwen- 
dung der folgenden Komponenten: 80 mM HEPES, pH 7.5, 12,5 mM MgCI 2 , 2 mM Spermidin, 40 mM Dithiothreitol, 2 
mM von jedem NTP. 1 Einheit RNasin/uJ, 50 jig/ml restringierte DNA und ca. 2 Einheiten/jJ T7 RNA Polymerase. Nach 
2 Std. bei 37°C wurde die Halfte der Menge an T7 Polymerase zugegeben und der Reaktionsansatz weitere 2h inku- 

55 biert. Zur Errtfernung von DNA wurde die Mischung mit saurem Phenol extrahiert (U. Kedzierski, J.C. Porte, 1991, Bio 
Techniques 10, 210), mit Isopropanol prazipitiert, das Pellet in Wasser gelGst und mit DNase (2 Einheiten pro ug DNA) 
fur 60 Min. bei 37°C inkubiert. Nach anschlieBender Extraktion mit saurem Phenol, saurem Phenol/Chloroform und 
Chloroform und Isopropanol- Prazipitation wurde die gelGste RNA mittel optischer Dichtemessungen quantifiziert und 
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ihre Unversehrtheit mittels Formaldehyd-Agarose-Gelelektrophorese uberpruft 
Beisplel 2 : Transfektionsexperimente mit der Hepatomazellinie Huh-7 

5 [0063] Bel samtlichen Transfektionsexperimenten wurde sorgfaitig darauf geachtet, daB jegliche Matrizen-DNA 
zuvor entfernt worden war, urn zu vermeiden, daB sdche DNA in transfizierte Zellen integrieren und diesen unabhangig 
von einer HCV-RepIikatipn eine Neomycin-Resistenz vermitteln konnte. Deshalb wurde im AnschluB an die in-vitro- 
Transkription ( Beispiel 1 D) die Reaktionsmischung mit 2 Einheiten DNase pro jig DNA fur 60 Min. be! 37°C behandelt 
und mit saurem Phenol, saurem Phenol/Chloroform und Chloroform extrahiert. Vor der Verwendung fOr die Transfektion 

io wurde die prSzipitierte RNA mittels Formaldehyd Agarose Gel Elektrophorese analysiert. 

[0064] Es wurden drei separate Transfektionsxperimente mit der hoch differenzierten humanen Hepatomazellinie 
Huh-7 (gemaB Nakabayashi et al. 1982, Cancer Res, 42. 3858) durchgefuhrt Dabei wurde jeweits 15 m9 RNA in 8 x 
10 6 Huh-7-Zellen mit Hirfe der Elektroporation eingebracht und diese Zellen anschlieBend in Kulturschalen von 10 cm 
Durchmesser ausgesat 24 Stunden nach der Aussaat wurde Neomycin (= G418) in einer Endkonzentration von 1 

75 mg/ml zugegeben. Das Kulturmedium wurde zweimal pro Woche gewechselt Nach 3 - 5 Wochen waren Weine Kolo- 
nien erkennbar. die isoliert und unter den gleichen Kulturbedingungen passagiert wurden. 

[0065] Die Zellkfone, die im Verlauf des erst en Experiments erhalten wurden, wurden isoliert und subpassagiert. 
Wahrend dieser Prozedur starben die meisten Klone und die Endausbeute betrug nur noch 9 Klone von Zellen, die mit 
den parentalen HCV-Subgenom-Konstrukten transfiziert worden waren und 1 Klon (Klone 8-1) von Zellen. die mit 
20 einem defekten HCV-Genom-Konstrukt, namlich einer defekten NS2-3* HCV-RNA transfiziert worden waren. AuBer 
einer verkurzten Verdopplungszeit und dem gelegentlichen Auftreten von irregular geformten Zellen wurden keine 
bestandigen morphologischen Unterschiede zwischen diesen 9 ZellWonen und dem einen ZellWon (Won 8-1) Oder den 
parentalen Huh-7 Zellen gefunden. 

[0066] Die Hauptkriterien fOr funktionierende HCV-Genomkonstrukte sind die Bildung von viraler RNA mit korrekter 
25 GrdBe und die Abwesenheit von Ontegrierter) Plasmid DNA, die eine G418-Resistenz ubertragen bzw. vermitteln 
kGnnte. 

[0067] Um die HCV-RNA in den Huh-7-Zellen zu bestimmen, wurde die Gesamt-RNA isoliert und mittels des gan- 
gigen Northern-Blot Verfahrens unter Verwendung einer Plusstrang-spezifischen Ribosonde (= RNA-Sonde) analy- 
siert. HierfQr wurde von den jeweiligen ZellWonen Gesamt-RNA nach der Methode von Chomczynski und Sacchi 1 987, 

30 Anal. Biochem. 162. 156 isoliert, und 10 \iq RNA, was dem Gesamt-RNA-GehaK von 0.5 - 1 x 10 6 Zellen entspricht, 
mittels denaturierender Formaldehyd-Agarose-Gelelektrophorese aufgetrennt (Spuren 3 bis 12 der Fig. 1 B). Als Grd- 
Benmarker mit authentischer Sequenz wurden gleichzeitig 10 9 in-vitro-Transkripte (ivtr ). die zu den l 389 /NS2-3'/wt Oder 
den l389/NS3-3ywt Replikon-RNAs korrespondieren, mit aufgetrennt (Spur 1 bzw. Spur 2). Die aufgetrennte RNA wurde 
auf Nylon-Membranen transferiert und mit radioaktiv marWerter Plusstrang-spezifischer RNA-Sonde. die komplemen- 

35 tar zu dem kompletten NPT-Gen und der HCV-IRES von NuWeotid 377 bis NuWeotid 1 war, hybridisiert Die Positionen 
der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angegeben, die Gr6Ben (Anzahlen der 
NuWeotide) der RNA-Marker sind links von Spur 1 angegeben. Die RNA Marker-Fragmente enthalten HCV-Sequenzen 
und hybridisieren deshalb mit der Ribosonde (= RNA-Sonde). Die Ergebnisse dieser Analyse sind in Fig. 1 B darge- 
stelft 

40 [0068] Mit Ausnahme des mit dem defekten HCV-Genom-Kbnstrukt transf izierten Klons 8-1 , lieferten alle ZellWone 
homogene HCV-RNAs korrekter Lange (ca. 8640 NuWeotide im Fall des NS2-3' und ca. 7970 NuWeotide im Fall des 
NS3-3' Replikons). Dieser Befund ist ein Indiz dafur, daB die funktionalen Replikons bzw. diefunktionalen HCV-Genom- 
Konstrukte die G418 Resistenz ubertragen. Um auszuschiieBen, daB die G418 Resistenz auf eine Plasmid-DNA 
zuruckzufuhren ist, die in das Genom der Huh-7 Wirtszelle integriert ist und unter der Kontrolle eines zelluiaren Promo- 

45 tors transkribiert wird. wurde von jedem Klon die DNA mittels einer NPT-Gen-spezifischen PCR untersucht Hierbei 
wurde aus den selektierten Huh-7-ZellWonen die DNA mittels Verdau mit Proteinase K (40jig/ml f 1h, 37°C) in 
10mMTris, pH7,5, 1mM EDTA. 0.5% SDS und anschlie Bender Extraktion mit Phenol, Phenol/Chloroform und Isopro- 
panolprazipitation isoliert. Das DNA-Prazipitat wurde in 10 mM Tris (pH 7,5) und 1 mM EDTA gelSst und 1 Stunde mit 
Rnase A inkubiert Im AnschluB an eine Phenol/Chloroform Extraktion und Ethanol Prazipitation wurde 1 jig DNA, ent- 

so sprechend 4 - 8 x 10 4 Zellen, mittels PCR unter Einsatz NPT-Gen-spezifischer Primer (S'-TCAAGACCGACCTG 
TCCGGTGCCC-3' und 5'-CTTGAGCCTGGCGAACAGTTCGGC-3') analysiert und ein DNA-Fragment bestehend aus 
379 NuWeotiden erzeugt Die Spezifitat des PCR-Produkts wurde mittels Southern Blot Verfahren nachgewiesen, 
wobei ein Digoxigenin-markiertes DNA Fragment eingesetzt wurde. das zu dem NPT-Gen korrespondiert Als Positiv- 
Kontrollen (zum Nachweis etwa vorhandener korttaminierender NuWeinsauren) wurde das PCR- Verfahren mit 10 7 

55 Plasmid Molekulen Oder 1 \ig DNA aus einer BHK Zellinie, die stabil mit einem Neomycin- Resistenz -Gen transfiziert 
war, durchgefuhrt, und als Negativ-Kontrolle wurde die PCR mit denselben Reagenzien aber ohne zugesetzte DMA 
durchgefuhrt 

Die Ergebnisse dieser Untersuchung sind in Fig. 1 C dargestellt Die Spuren 1 und 2 reprasentieren die Positiv-Kbntrol- 



18 



EP 1 043 399 A2 



len, Spur 13 reprasentiert die Negativ-Kontrolle. Die Zahlenangaben links der Spur 1 bezeichnen die GrdBe der 
NuWeotid-Marker-MolekQIe. AuBer in Klon 7-3 (Fig. 1C, Spur 3), der von Zellen nach Transfektion mit einem NS2-3* 
Replikon/NS2-3 , HCV-Genom-K6nstrukt stammt, und in Klon 8-1 (Fig. 1C, Spur 12), der von Zellen nach Transfektion 
mit einem defekten HCV-Genom-Kbnstrukt stammt, war in keinem ZellWon eine NPT-DNA nachweisbar. Dieser Befund 

5 ist ein weiteres Indiz dafQr, daB die G418 Resistenz der meisten Klone durch die repiizierende HCV-RNA vermittelt 
wurde. Aber auch unabhangig von diesen Ergebnissen ist es unwahrscheinlich, daB HCV-RNAs mit korrekter Gr66e 
von integrierter Plasmid DNA erzeugt wird, denn die fur die in-vrtro-Transkription verwendeten Plasmide enthaften 
weder einen eukaryontischen Promotor noch ein Polyadenylierungssignal. Im Fall des Klons 7-3 ist die Resistenz des- 
halb hochst wahrscheinlich sowohl durch das HCV-RNA-Konstrukt bzw. die repiizierende HCV-RNA ais auch durch 

10 eine integrierte NPT DNA Sequenz vermittelt worden, wahrend die Resistenz der Zellen von Klon 8-1 ausschlieBlich 
auf die integrierte Plasmid DNA zuruckzufuhren ist. 

[0069] Urn zu bestatigen, daB die G41 8 Resistenz von einer autonom replizierenden HCV-RNA vermittelt ist, wurde 
der Klon 9-13 (Fig. 1 B, Spur 11) weiteren Tests unterworfen. Won 8-1. der integrierte Kopien des NPTGens tragt, 
wurde Qberall als Negativkontrolle eingesetzt. Mit dem Ziel. die Anwesenheit von NPT-DNA im Klon 9-13 rigoros aus- 

is zuschlieBen, wurde eine PCR durchgefuhrt, die den Nachweis von < 1 000 NPTGen-Kbpien in ~ 40.000 Zellen erlaubt. 
Das Ergebnis dieser PCR ist in Fig. 2A dargestelit. Im einzelnen wurde bei dieser PCR wie folgt verfahren: 
Es wurden jeweils 10 6 - 10 2 Plasmid MolekOle (l 3 77/NS3-3Ywt) entweder direkt (Spuren 7-11) oder nach Zugabe von 
jeweils 1 ug 9-13 DNA (Spuren 2 - 6) in dem Test eingesetzt Die Spezifitat der amplifizierten DNA Fragment wurde mit- 
tels Southern Blot unter Verwendung einer NPT-spezifischen Sonde bestimmt Eine PCR ohne DNA-Sonde wurde als 

20 Negativ-Kbntrolle durchgefuhrt (Spur 12). 

Selbst mit dieser sensitiven Methode wurde in einem jig DNA des Zellklons 9-13 keine Plasmid DNA gefunden (Spur 
1). Urn die Menge an HCV Plus- und Minusstrang RNAs in diesen Zellen abzuschatzen, wurde eine VerdOnnungsreihe 
von Gesamt-RNA mit dem Northern-Blot-Verfahren unter Verwendung einer Plus- oder Minusstrang-spezrfischen 
radioaktiv markierten Ribosonde (= RNA-Sonde) analysiert HierfOr wurden jeweils 8, 4 oder 2 jig Gesamt-RNA, die 

25 aus den ZellWonen 9-1 3 und 8-1 isoliert worden waren, parallel zu bekannten Mengen analoger in-vitro-Transkripte mit 
Plus- oder Minusstrang-Polaritat (Kontroll-RNAs) im Northern-Blot-Verfahren analysiert und anschlieBend einer Hybri- 
disierung unterworfen. Die Hybridisierung wurde mit einer Plusstrang-spezif ischen Ribosonde, die das komplette NPT- 
Gen und die HCV-IRES abdeckte fplusstrand', obere BildtafeJ). oder mit einer Minusstrang-spezifischen RNA-Sonde, 
die zu der N S3 -Sequenz komplemerrtar war f minusstrand\ untere Bildtafel) durchgefuhrt. Die Pfeile markieren die 

30 Positionen von Replikon-RNA. Die Ergebnisse dieser Analyse sind in Fig. 2 B dargestelit 

Im Fall des Plusstrangs wurden ca 10 8 Kbpien/ug Gesamt-RNA nachgewiesen, was 1000 - 5000 HCV-RNA-MolekGlen 
pro Zelle errtspricht, wahrend die Menge an Minusstrang- RN A 5- bis 10-fach niedriger war. Dieses Ergebnis stimmt mit 
der Annahme uberein, daB die Minusstrang RNA die replikative Zwischenform bzw. Zwischenkopie ist, die als Vorlage 
fur die Synthese der Plusstrang Molekule dient 

35 Da die Reakb'on im wesentlichen von der viralen RNA-abhangigen RNA Polymerase katalysiert wird, solfte die Syn- 
these der HCV-RNAs resistent gegen Dactinomycin sein, einem Antibiotikum, das selektiv die RNA-Synthese von 
DNA-Matrizen inhibiert, nicht jedoch die RNA-Synthese von RNA-Matrizen. Um diese Vermutung zu bestatigen, wur- 
den Zellen mit [ 3 H] Uridin in Anwesenheit von Dactinomycin inkubiert, die radioaktiv markierten RNAs extrahiert, mittels 
denaturierender Agarose-Gel-Elektrophorese aufgetrennt und mit Hilfe eines handelsOblichen Bio- Imagers unter Ver- . 

40 wendung einer [ 3 H] -sensitiven Bildplatte analysiert. HierfOr wurden jeweils ca. 5 x 10 5 Zellen der Klone 9-13 und 8-1 
mit 100 Ci [ 3 H]Uridin fur 16 Std. in Abwesenheit (-) Oder Gegenwart (+) von 4 ug/ml Dactinomycin (Dact) inkubiert. 
Im AnschluB an diese Markierungsreaktion wurde die Gesamt-RNA prapariert und mittels Formaldehyd-Agarose-Gel- 
Elektrophorese analysiert In den beiden ersten Spuren ist nur 1/10 der Gesamt-RNA dargestelit Die radioaktiv mar- 
kierte RNA wurden mit einem BAS-2500 Bio- Imager (Firma Fuji) sichtbar gemacht 

45 Die Ergebnisse dieser Analyse sind in Fig. 2 C dargestelit In Ubereinstimmung mit dem Inhibitor-Profil der NS5B Poly- 
merase (Behrens et al. v 1 996, EMBOJ. 1 5, 1 2 und Lohmann et al. t 1 997, J Virol. 71 , 841 6) war die Replikation der HCV 
RNA nicht durch Dactinomycin beeinf luBt worden, wahrend die Synthese von zellulSrer RNA gehemmt worden war. Um 
die Identitat der viralen RNA zu bestatigen, wurde eine RT-PCR zur ReWonierung der replizierten Sequenzen durchge- 
fuhrt. Die Sequenzanalyse der reWonierten RNA zeigte, daB die RNA in dem Klon 9-13 HCV-spezrfisch ist und mit dem 

so transf izierten Transkript des HCV-Kbnstrukts I 3 77/NS3-3Vwt ubereinstimmt. 

[0070] Zur Analyse der viralen Proteine wurden die betreffenden Zellen zunSchst metabolisch mit [ 35 S] Methio- 
nin/Cystein radioaktiv markiert anschlieBend lysiert und danach die HCV-spezif ischen Proteine mittels Immunoprazi- 
pitation aus den Zell-Lysaten isoliert. Die Ergebnisse dieser Analysen sind in Fig. 3 A dargestelit. Im einzelnen wurde 
dabei wie folgt verfahren: Zellen der ZellWone 9-13 (wt) und 8-1 (A) waren durch Behandlung fur 16 Stunden mit einer 

55 dem Fachmann geiaufigen und im Handel erhaitlichen Protein-Markierungs-Mischung (z.B. NEN Life Science) metabo- 
lisch radioaktiv markiert worden. Mittels Immunoprazipitation (IP) unter nicht-denaturierenden Bedingungen (z.B. nach 
Bartenschlager et al., 1995, J. Virol 69, 7519) und unter Verwendung von drei verschiedenen Antiseren (3/4, 5A, 5B, 
gemaB Markierung am oberen Ende der Spuren 1 bis 12) waren die HCV-spez'rfischen Proteine vom Zell-Lysat abge- 
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trennt worden.. Die Immunokomplexe wurden mittels Tricine SDS-PAGE analysiert und mittels Autoradiographie sicht- 
bar gemacht. Um authentische GroBenmarker zu erhalten, wurde das homologe ReplikonkDnstrukt l 3 7 7 /NS3-3'/wt einer 
transienten Expression mit dem Vaccinia Virus T7-Hybrid System in Huh-7 Zellen unterworfen. Die dabei erhaltenen 
Produkte waren als GroBenmarker (Spuren 7-9) parallel zu den Zellen der Klone 9-13 und 8-1 behandelt worden. 
5 Identifizierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Molekulargewichte (in Kilodalton) sind am 
rechten Rand von Spur 9 angegeben. Es ist anzumerken, daB das verwendete NS3/4-spezifische Antiserum (3/47 
bevorzugt mit NS4A und NS4B reagiert, was zu einer UnterreprSsentation von NS3 fOhrt. 

[0071] Alle viralen Antigene waren eindeutig nachweisbar und ihre apparenten Molekulargewichte zeigten keine 
Abweichungen gegenQber denjenigen, die nach transienter Expression desselben bicistronischen HCV-RNA-Kon- 

io strukts in den ursprQnglichen Huh-7 Zellen ermittelt wurden. Um die subzellula/e Verteilung der viralen Antigene zu 
bestimmen, wurde eine Immunofluoreszenz-Nachweisreaktion unter Einsatz von NS3- und NS5A-spezifischen Antise- 
ren durchgefuhrt (z.B. nach Bartenschlager etal.. 1995, J. Virol. 69, 7519). HierfQr wurden Zellen der Klone 9-13 (wt) 
und 8-1 (A) 24 Std. nach dem AussSen auf Deckgiasern mit Methanol/Azeton fixiert und mit polyWonalen NS3- Oder 
NS5A-spezifischen Antiseren inkubiert. Die gebundenen Antikfirper wurden mit einem kommerziell erhaitlichen FITC- 

is konjugierten Anti-Kaninchen-Antiserum sichtbar gemacht. Zur UnterdrOckung unspezrfischer Fluoreszenzsignale wur- 
den die Zellen mit dem Farbstoff 'Evans Blue' gegengefarbt 

[0072] Die Ergebnisse dieses Nachweistests sind in Fig. 3 B dargestellt Mit beiden Antiseren war eine starke Fluo- 
reszenz im Zytoplasma nachweisbar. Die NS5A-spezifischen Antiseren fOhrten auBerdem zu einer schwachen Zell- 
kern-Fluoreszenz, wasdarauf hindeutet, daB zumindest Heine Mengen dieses Antigens auch zum Zellkern gelangen. 

20 Die generell dominierende PrSsenz der viralen Antigene im Zytoplasma ist jedoch ein starkes Indiz daf Or, daB die HC V- 
RNA Replikation im Zytoplasma stattfindet — so wie das bei den meisten RNA-Viren der Fall ist 
[0073] Diese Ergebnisse belegen War, daB mit dem hier beschriebenen Versuchsansatz der Aufbau eines Zellkul- 
tursystems fur das HCV gelungen ist, dessen Effizienz alles bisher bekannte um Gr6Benordnungen ubersteigt und erst- 
malig den Nachweis viraler NuWeinsauren und Proteine mit konventionellen und bew&hrten biochemischen Methoden 

25 erlaubt. Erst diese Effizienz erlaubt uberhaupt detailierte Untersuchungen der HCV-Pathogenese, genetische Analysen 
verschiedener HCV-Funktionen und ein genaues Studium der VimsVWirtszellwechselwirkungen, wodurch sich neue 
Ansatzpunkle fur die Entwicklung einer antiviralen Therapie definieren lassen. 

Beispiel 3 : Transf ektion von Huh-7 Zellen mit HCV-Genomkonstrukten 

30 

[0074] Huh-7 Zellen werden wie in Beispiel 2 beschrieben transf iziert und selektioniert, wobei hier jedoch selektio- 
nierbare Konstrukte verwendet werden, die das vollstandige Virusgenom enthalten. Die erhaltenen ZellWone werden 
analog dem Beispiel 2 mittels PCR auf Abwesenhe'rt von HCV- DMA untersucht und die produktive Replikation der HCV- 
RNA wind danach mittels Northern Blot, [ 3 H]Uridinmarkierung in Anwesenheit von Dactinomycin, Nachweis der viralen 

35 Proteine bzw. Antigene vorzugsweise mit Hilfe des Western Blots, der ImmunoprSzipitation oder der Immunf luoreszenz 
nachgewiesen. Im Gegensatz zu den im Beispiel 2 beschriebenen AnsStzen lassen sich mit dem hier beschriebenen 
Konstrukt auBerdem vollstandige und sehr wahrscheinlich infektiose Viren erhalten, was bei den dort (in Beispiel 2) 
beschriebenen Subgenomkonstrukten nicht der Fall ist. Diese Viren, die in der Zelle und dem Zellkulturuberstand vor- 
handen sind, werden beispielsweise mittels Ultrazentrifugation, ImmunprSzipitation oder FaJlung mit Polyethylenglykol 

40 konzentriert und alle exogenen, d.h. nicht im Viruspartikel eingebauten NuWeinsSuren werden mittels Inkubation mit 
NuWeasen (RNase, DNase, Mikrococusnuklease) verdaut Auf diese Weise lassen sich alle kontaminierenden NuWe- 
insauren, die nicht im schutzenden Viruspartikel enthalten sind, entfernen. Die geschutzte virale RNA wird nach Inak- 
tivierung der NuWeasen, beispielsweise mittels Inkubation mit Proteinase K in einem SDS-haltigen Puffer durch 
Extraktion mit Phenol und Phenol/Chloroform isoliert und mittels Northern Blot oder RT-PCR unter Verwendung HCV- 

45 spezifischer Primer nachgewiesen. Auch in diesem Versuchsansatz ist die Kombination des beschriebenen HCV-Kon- 
sensusgenoms mit einem Selektionsmarker entscheidend fur die effiziente Produktion von viraler RNA, viralem Protein 
und damit von HCV-Partikeln. 

Beispiel 4 : Herstellung und Anwendung eines HCV-RNA Konstrukts, bei dem das Resistenzgen Ober ein Ribo- 
50 zym bzw. eine Erkennungsstelle fur ein Ribozym mrt der HCV-Subgenom-Sequenz verbunden ist 

[0075] Es wird ein HCV- RNA-Konstrukt gemSB Beispiel 1 oder Beispiel 3 hergestellt, bei dem ein Antibiotikumresi- 
stenzgen uber ein Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. Sol- 
che Konstrukte sind in Fig. 7 schematisch dargestellt. Huh-7 Zellen werden wie in Beispiel 2 beschrieben mit diesem 
55 HCV-RNA-Konstrukt transfiziert. Nach der Transfektion in die Zellen erfolgt zunachst die Selektion mit dem entspre- 
chenden Antibiotikum. In den dabei erhaltenen ZellWonen wird das einWonierte Ribozym aktiviert oder, im Fall eines 
Konstrukts, das eine Erkennungsstelle fur ein Ribozym trSgt, wird das Ribozym in die Zelle eingeschleust (z.B. mittels 
Transfektion eines Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entsprechende 



20 



EP 1 043 399 A2 



Ribozym eingesetzt wurde). In beiden Fallen wind durch die ribozyrrrvermittelte Spaltung das Resistenzgen von der 
HCV-RNA-Sequenz abgetrennt Das Ergebnis ist im Fall des HCV-Genom-Konstrukts ein authentisches HCV-Genom 
ohne Resistenzgen, das zur Bildung authentischer infektioser Viruspartikel befahigt ist. Im Fall des HCV-Subgenom- 
Konstrukts entsteht ein HCV-Repliton ohne Resistenzgen. 

5 

Beisoiel 5 : Kotransfektion eines HCV-RNA-Konstrukts mit elnem separaten Luziferase-Transfektionskonstrukt 

[0076] Es wird ein HCV-RNA-Konstrukt gemaB Beispiel 1 (A) oder Beispiel 3 Oder BeispieJ 4 hergestellt. Parallel 
dazu wird ein Transfektionskonstrukt hergestellt, welches das Luziferasegen umfaBt, wobei dieses Luziferasegen ver- 

io mittels einer ersten NuWeotidsequenz, die fOr eine HCV-Protease- (z.B. NS3-Protease-) Spaltungsstelle kodiert. mit 
einer zweiten NuWeotidsequenz, die fOr ein anderes Protein oder einen Teil eines anderen Proteins kodiert, verbunden 
ist. HCV-RNA-Konstrukt und Transfektionskonstrukt werden in beliebige Wirtszellen, vorzugsweise Hepatomazellen. 
insbesondere Huh-7-Zellen, eingeschleust. Dies kann auf die in Beispiel 2 beschriebene Art und Weise geschehen. 
Das Produkt des modifizierten Luziferasegens ist ein Luzrferase-Fusionsprotein, in dem die Luziferase auf Grund der 

is Fusion mit dem Fremdanteil inaktiv ist In transfizierten Zellen mit hoher HCV-Rep!ikation wird das Fusionsprotein, das 
ja eine Schnittstelle fOr eine HCV-Protease enthalt gespalten und damit die aktive Form der Luziferase freigesetzt, die 
sich durch luminometrische Messung bestimmen laBt Wird die Replikation des HCV-RNA-Kbnstrukts gehemmt, wird 
das Fusionsprotein nicht gespalten und keine aktive Luziferase freigesetzt. Infolgedessen ist die quantitative Bestim- 
mung der Luziferase ein MaB fOr die Replikation des HCV-Subgenom-Konstrukts. Anstelle des Luziferasegens kann 

20 ebensogut ein anderes Reportergen verwertdet werden, das in analoger Weise modif iziert ist, so daB seine Expression 
von der Virusreplikation abhangt, obwoh! dieses Reportergen nicht Bestandteil des HCV-Subgenom-Konstrukts ist. Es 
kann auch ein zellulares Protein, welches durch die HCV-Proteine oder NuWeinsaure inaktiviert oder aktrviert wird, als 
sogenannter Surrogatmarker verwendet werden. In diesem Fall ist die Expression bzw. Aktivitat dieses Surrogatmark- 
ers ein MaB fOr die Replikation der viral en DNA. 

25 

Beispiel 6 : Herstellung von HCV-Subgenom-Konstrukten mit integrierten Fremdgenen zur Verwendung als 
leberzellspezif ische GenfShren fur die Gentherapie 

[0077] Diese rekombinanten und selektionierbaren HCV-Subgenom-Kbnstrukte werden in trans-komplementie- 
30 rende Helferzellinien transfiziert, d.h. in Zellinien, die induzierbar oder konstrtutiv die fehlenden Funktionen (beispiels- 
weise die Strukturproteine) exprimieren. ZellWone, die ein funktionelles HCV-Subgenom-Konstrukt enthalten, lassen 
sich durch errtsprechende Selektion etabiieren. Die von der Wirtszelie exprimierten Virus-Strukturproteine erlauben die 
Bildung von Viruspartikeln, in die die RNA der HCV-Subgenom-Kbnstrukte eingeschleust wird. Das Ergebnis sind also 
virus-ahnliche Partikel, die ein erfindungsgemaBes HCV-Subgenom-Konstrukt einschlieBlich des einWonierten Fremd- 
35 gens enthalten und die dieses mittels Infektion auf andere Zellen ubertragen konnen. Ein Beispiel fur ein solches Kon- 
strukt ist in Fig. 8 dargestellt Es besteht auch die MOglichkeit, das hier beschriebene erfindungsgemaBe HCV- 
Subgenom-Konstrukt mit integriertem Fremdgen direkt als Expressionsvektor einzusetzen. Dabei wird analog dem vor- 
genannten Verfahren vorgegangen, allerdings mit dem Unterschied, daB Zellinien transfiziert waden, die keine trans- 
komplementierenden Faktoren exprimieren. In diesem Fall dient das HCV-Konstrukt also lediglich als 
40 Expressionsvektor. 

Beispiel 7 : Herstellung zellkultur-adaptierter HCV-RNA-Konstrukte 

(A) Isolationsverfahren 

45 

[0078] Fur die Bestimmung adaptiver Mutationen und die Herstellung zellkultur-adaptierter HCV-RNA-Kbnstrukte 
wurde wie folgt verfahren: Zellen wurden mit einem HCV-RNA-Konstrukt wie unter den Beispielen 1 und 2 beschrieben 
transfiziert und G41 8-resistente ZellWone hergestellt Zur Bestimmung der Replikationskompetenz (darunter wird in 
diesem Zusammenhang die Anzahl G418-resist enter ZellWone verstanden, die pro Mikrogramm transfizierter HCV- 

so RNA bzw. HCV-RNA-Konstrukt erhalten wird) wurde exemplarisch die Gesamt-RNA aus einem der ZellWone, genannt 
9-13 (Fig. 1B, Spur 11) isoliert und die Menge der darin enthartenen HCV-RNA mittels Northern-blot wie in Fig. 2 B 
beschrieben bestimmt 10 Mikrogramm der Gesamt-RNA, die ca. 10 9 Molekule HCV-RNA enthielt, wurde anschlieBend 
per Elektroporation in naive Huh-7 Zellen eingeschleust (Fig. 9). Parallel dazu wurden 10 9 in vitro Transkripte der ana- 
logen neo-HCV-RNA, die mit isolierter Gesamt-RNA aus naiven Huh-7 Zellen auf eine Gesamt-RNA-Menge von 10 ug 

55 aufgefullt worden war. in naive Huh-7 Zellen transfiziert. Nach Selektion mit G418 wurde die Anzahl der Zellkolonien, 
ausgedruckt in 'colony forming units (cfu) pro Mikrogramm RNA* in den beiden Ahsatzen bestimmt Bei einer Kohzen- 
tration von 500 ug/ml G418 im Selektionsmedium betrug die Zahl der Kblonien, die mit der in der fsolierten Gesamt- 
RNA enthaltenen HCV-RNA erhalten wurde, ca. 100.000 cfu pro Mikrogramm HCV-RNA. Dagegen wurden mit dersel- 
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ben Menge in vitro transkribierter HCV-RNA nur 30 - 50 Kblonien erhalten. Dieses Ergebnis belegt, daB die spezifische 
Infektiositat der HCV-RNA, die aus den ZellWonen isoliert wurde, ca. 1.000 - 10.000-fach hGher ist als die Infektiositat 
der analogen in vitro Transkripte. Das methodische Vorgehen ist in Fig. 9 dargestelft. 

[0079] Mit Hilfe der 'long-distance RT-PCR' wurde die HCV-RNA aus der Gesamt-RNA der 9-1 3 Zellen amplifiziert 
s die PCR-Amplif ikate Woniert und zahlreiche Klone sequenziert. Ein Vergleich der Sequenzen dieser reWonierten RNAs 
mit der Sequenz der RNA, die ursprungfich in die naiiven Huh-7 Zellen eingeschleust wurde ergab, daB die reWonierten 
RNAs zahlreiche Aminosaureaustausche besaBen, die Qber die gesamte HCV-Sequenz verteift waren (Fig. 10). Sf/I- 
Fragmente dieser reWonierten Mutanten wurden im Austausch gegen das analoge S//I-Fragment des ursprOnglichen 
Replikonkonstrukts in dieses eingefuhrt und RNAs der jeweiligen Mutanten wurden in naTve Huh-7 Zellen einge- 
io schleust. Nach Selektion mit G418 wurde dann fur jede HCV-RNA-Mutante die Zahl der gebildeten Kblonien bestimmt. 
Wahrend mit der Ausgangs-RNA nur 30 - 50 Kblonien pro Mikrogramm RNA erhalten wurde war die Koloniezahl bei 
zwei der reWonierten Varianten deutlich h6her (Fig. 10). Im Fall der HCV-RNA-Kbnstrukte 9-131 und 9-13C betrug die 
spezifische Infektiositat 100 - 1.000 cfu pro Mikrogramm RNA und beim 9-1 3F Replikon sogar 1.000 - 10.000 cfu pro 
Mikrogramm RNA. Diese Ergebnisse zeigen, daG die Aminosaureaustausche in dem analysierten NS3-5B-Bereich der 
is Mutanten 9-131, 9-1 3C und insbesondere 9-13F zu einer deutlichen Erhotiung der Replikationskompetenz fOhrten. 
Demgegenuber waren alie anderen HCV-RNA-Konstrukte (9-13 A, B, G. H und K) nicht mehr replikationskompetent, 
enthielten also letale Mutationen. 

[0080] Zwecks Beantwortung der Frage. welche der Aminosaureaustausche im 9-13F-Kbnstrukt zur Steigerung 
der Replikation fuhrten, wurden die Austausche einzeln Oder in Kombination in das Ausgangs-HCV-RNA-Konstrukt ein- 

20 gefOhrt und die entsprechenden RNAs in naTve Huh-7 Zellen eingeschleust Das Ergebnis der Transfektionen mit die- 
sen RNAs ist in Tabelle 1 zusammengefaBt. Daraus wird ersichtlich, daB im vorliegenden Beispiel die hohe 
Replikationskompetenz durch mehrere Mutationen bedingt ist. Den groBten Beitrag leisten die Aminosaureaustausche 
in den HCV-RNA-Abschnitten NS5A und NS4B. Auch die einzelnen Austausche in der NS3-Region leisten einen Bei- 
trag, der moglicherweise auf einem Synergismus dieser Einzelaustausche beruht 

25 Diese Befunde belegen, daB es durch die G418-Selektion der Zellen, die mit den neo-HCV-RNA-Konstrukten transfi- 
ziert wurden, zur Anreicherung solcher HCV-RNAs kam, die eine deutlich hohere Replikationskompetenz hatten. Mit 
dem hier beschriebenen Versuchsansatz lassen sich HCV-RNA-Kbnstrukte mit sehr unterschiediicher Replikationseffi- 
zienz selektionieren. Je h6her die Kbnzentration des Antibiotikums in dem Selektionsmedium ist in/auf dem die HCV- 
RNA-Kbnstrukt-haltigen Zellen zwecks Selektion kultiviert werden, desto hfiher muB der Grad an adaptiven Mutationen 

30 und damit die Replikationseffizienz in den betreffenden HCV-RNA-Kbnstrukten sein, damit die Zellen auswachsen kOn- 
nen. Werden die Selektionen mit niedrigeren Antibiotikum-Konzentrationen durchgefuhrt konnen auch solche Zellen 
Qberieben und sich vermehren, die im Vergleich geringer adaptive Mutationen und eine weniger hohe Replikationseffi- 
zienz aufweisen. 

Das bisher beschriebene HCV-RNA-Konstrukt 9-1 3 F, das mehrere adaptive Mutationen enthielt hatte eine erwiesener- 

35 maBen hOhere Replikationseffizienz als die parental e HCV-RNA. Um HCV-RNAs mit noch hdherer Replikation in Zell- 
kultur zu erhalten, wurde die HCV-RNA, die in der Gesamt-RNA ernes ausgewahlten ZellWons enthalten war, mehrfach 
in naTven Huh-7 Zellen passagiert Dieser ausgewahlte ZellWon, genannt 5-15, wurde durch Transfektion mit dem HCV- 
RNA-Kbnstrukt l 389 /NS3-3' erhalten (Rg. 1). Er entspricht weitgehend dem ZellWon 9-13, der durch Transfektion mit 
einem HCV-RNA-KonstruW hergestelH wurde, das eine um 22 NuWeotide kurzere HCV-IRES besaB (l 3 77/NS3-3'; Fig. 

40 1). 10 Mikrogramm Gesamt-RNA, isoliert aus dem ZellWon 5-15, wurden mittels Elektroporation in naiive Huh-7 Zellen 
eingeschleust und die Zellen einer Selektion mit 1 mg/ml G418 unterzogen. Aus einem der so erzeugten ZellWone 
wurde wiederum Gesamt-RNA isoliert, in naTve Huh-7 Zellen transfiziert und analog selektioniert. Dieser Vorgang 
wurde insgesamt viermal wiederhort. Nach der vierten Passage wurde aus einem ZellWon die Gesamt-RNA isoliert und 
die neo-HCV-RNA mit Hilfe der long-distance RT-PCR' amplifiziert. Das amplifizierte DNA-Fragment wurde mit dem 

45 RestriWionsenzym Sfil verdaut und in das Sfil-restringierte Ausgangskonstrukt l 38 9/NS3-3' inseriert. Insgesamt wurden 
Qber 100 DNA-KIone erhalten und zunachst mittels Restriktionsverdau analysiert In vitro transkribierte RNA von ca. 80 
dieser Klone wurde jeweils in naTve Huh-7 eingeschleust und einer Selektion mit 500mg/ml G418 unterzogen. Von den 
80 untersuchten neo-HCV- RNA- Varianten erwiesen sich die allermeisten als repIikationsdefeW. Bei zwei Mutanten, 
genannt 5.1 und 19, war die spezifische Infektiositat, ausgedruckt als 'colony forming units' pro Mikrogramm RNA, 

so jedoch sehr deutlich erh6ht (Tabelle 2). Durch mehrfache Passage der RNA in Zellkultur lassen sich offensichtlich HCV- 
RNAs herstellen, deren Replikationseffizienz aufgrund von Mutationen (sog. "adaptiven Mutationen) mehrere Gr6Ben- 
ordnungen h&her ist als die der ursprunglich aus dem Patienten Wonierten RNA. 

(B) Modif ikationsverfahren 

55 . 

[0081] Solche nach (A) erzeugtenn und identifizierten adaptiven Mutationen kGnnen in ein wenig replikationskom- 
petentes HCV-RNA-Kbnstrukt ubertragen werden und fuhren zu einer massiven Steigerung der Replikation dieses 
KonstruWs. Diese Steigerung ist so hoch, daB damit nachweislich HCV-RNAs in Zellkultur zur Replikation gebracht 
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werden konnen, die kein selektierbares Markergen mehr besitzen. Rg. 12 zeigt einen Vergleich der Replikationseffizi- 
enz von HCV-RNAs. die entweder der Ausgangssequenz Oder den adaptierten Sequenzen 9-1 3F bzw. 5.1 entspra- 
chen. Zwecks einfacher Messung wurde das neo-Gen entfernt und durch das Gen fOr die Luziferase ersetzt A!s 
Negativkontrolle diente wiederum ein HCV-RNA-Konstrukt, das auf Grund einer inaktivierenden Mutation der NS5B 

5 RNA-Polymerase replikationsdefekl war. Schon 24 Stunden nach der Transfektion erkenrrt man einen deutlichen Unter- 
schied in der Luziferaseaktivitat zwischen der defekten RNA und den 9-13F bzw. 5.1-Kbnstrukten wahrend zwischen 
der defekten RNA (318 DN) und dem Ausgangs-RNA-Kbnstrukt (wt) das keine adapth/en Mutationen besaB, kaum ein 
Unterschied zu sehen war. Wahrend des gesamten Beobachtungszeitraums wurde die hochste Luziferaseaktivitat und 
damit die h6chste Replikation mit der 5.1 -RNA erhalten. Diese Befunde belegen nicht nur die hohe Replikationseffizi- 

to enz dieser RNA, sondern zeigen auch, daB es moglich ist, mit adaptierten HCV-RNA-Konstrukten ein Zellkultursystem 
aufzubauen, fur das die Anwesenhe'rt eines selektierbaren Gens nicht mehr notwendig ist. Eine zusammenfassende 
Obersicht der NuWeotid- und Aminosaureunterschiede zwischen dem Ausgangskonstrukt und den Mutanten 9-1 3F, 5.1 
und 19 ist in Tabelle 3 gegeben. 

15 Beispiel 8: Herstellung zellkultur-adaptierter HCV-RNA- Vollangengenome 

[0082] In den Beispielen 1 bis 7 wurde stets eine subgenomische HCV-RNA verwendet, der die gesamte Struktur- 
proteinregion von Core bis einschlieBiich p7 bzw. NS2 fehlte. im vorliegenden Beispiel 8 wird gezeigt, daB es moglich 
ist. mit Hilfe der adaptierten NS3-5B-Sequenz ein HCV-Vollangengenom in Zellkultur zur Replikation zu bringen. Zu 
20 diesem Zweck wurde zunachst das Sfil-Fragment der gemaB Beispiel 7 hergestellten, hoch adaptierten HCV-RNA 5.1 
in ein selektionierbares HCV-Vollangengenom transferiert (Rg. 12). Dieses HCV-Genom wurde in naive Huh-7 Zellen 
transfiziert und einer Selektion mit unterschiedlichen G418-Konzentrationen unterzogen. In Abhangigkeit von der 
Selektionsstarke (der G418-Konzentration) wurde eine unterschiedlich groBe Zahl an ZellWonen erhalten (Rg. 12 B) . 
Im Vergleich dazu wurden mit dem unveranderten HCV-Vollangengenom. das keine-adaptiven Mutationen enthielt, 
25 keine Kolonien erhalten, ebenso mit der Negativkontrolle, die auf Grund einer inaktivierenden Mutation in der NS5B 
RNA-Polymerase replikationsdefekl war. Zum Nachweis daf Or, daB die so entstandenen ZellWone tatsachlich ein auto- 
nom replizierendes HCV-Vollangenkonstrukt enthielten, wurde Gesamt-RNA aus mehreren ZellWonen isoliert und mit- 
tels Northern-Blot analysiert. In alien ZellWonen war die Vollangen HCV-RNA eindeutig nachweisbar (Rg. 12). Damit ist 
eindeutig belegt, daB es mit Hilfe der an Zellkulturen adaptierten HCV-Sequenzen mdglich ist ein HCV-Vollangenge- 
30 nom herzustellen, das mit hoher Effizienz und autonom in einer Zellinie repliziert, d.h. es konnen mit dem. erf indungs- 
gemaBen System auch adaptierte HCV-Vollangengenome hergestellt werden. Da dieser Kion daruber hinaus die 
vollstandige HCV-Sequenz besitzt, also auch die fur die Viruspartikelbildung notwendigen Strukturproteine, ist es mit 
diesem System moglich, groBe Mengen infektioser Viruspartikel in Zellkulturen herzustellen. Zum Nachweis dieser 
Viren werden zellfreie Uberstande von Zellen, die ein replizierendes HCV-Vollangengenom tragen, auf naive Huh-7 Zei- 
ss len gegeben und die so infizierten Zellen einer Selektion mit G418 unterzogen. Jeder ZellWon, der urtter diesen Bedin- 
gungen auswachst, gent auf eine infizierte Zelle zurucfc Die Viren in den Zellkulturuberstanden von Zellen, die ein 
replizierendes HCV-Vollangengenom besitzen, konnen aber auch mit verschiedenen im Stand der Technik bekanrrten 
Verfahren wie Ultrazentrifugation oder Mikrodialyse angereichert und gereinigt werden und dann zur Infektion naiver 
Zellen verwendet werden. Mit diesem Verfahren ist eindeutig gezeigt, daB mit dem erf indungsgemaBen HCV-Zellkultur- 
40 system zellkultur-adaptierte HCV-Vollangengenome hergestellt werden kOnnen, die mit hoher Effizienz in Zellen repli- 
zieren und infektiOse Viren produzieren. Diese konnen ebenfalls durch Infektion eines Versuchstiers, vorzugsweise 
dem Schimpansen. nachgewiesen werden. 

Beispiel 9: Herstellung von HCV-Voliangen-Konstrukten und HCV-Subgenom-Konstrukten mit Reportergen. 

45 

[0083] Es wird ein HCV-RNA-Konstrukt hergestellt, bei dem anstelle des Antibiotikumresistenzgens ein Reporter- 
gen eingefugt wird (Rg. 13). Dabei kann die Replikation anhand der Menge bzw. der Aktivitat des Reportergens bzw. 
Reportergenprodukts bestimmt werden. Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luzrferase- 
gene, dem CAT-Gen (Chloramphenicol-Acetyl-Transferase-Gen), dem lacZ-Gen O^eta-Galaktosidasegen), dem GFP- 

so Gen (green fluorescence protein Gen), dem GUS-Gen (Glukuronidasegen) Oder dem SEAP-Gen (sezernierte alkali- 
sche Phosphatasegen). Diese Reportergene bzw. deren Produkte, namlich die entsprechenden Reporterproteine, k5n- 
nen z.B. mittels Ruoreszenz, Chemilumineszenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z.B. 
enzyme-linked immunosorbent assay, ELISA) bestimmt werden. Das Reportergen kann entweder von einer eigenen 
IRES exprimiert werden oder in Form eines Fusionsproteins, das entweder als solches aktiv ist oder mittels einer pro- 

55 teolytisch spaltbaren Aminosauresequenz so mit einem HCV-Protein verbunden ist. daB es von einer zellularen oder 
viralen (HCV-) Protease von diesem abgesparten wird. 



23 



EP1 043 399 A2 



Beispiel 10 : Herstellung von HCV-VoHSngen-Kbnstrukten mit integrierten Fremdgenen zur Verwendung als 
leberzellspezif ische GenfShre fur die Gentherapie Oder als Expressionsvektor. 

[0084] Das Konstrukt (Fig. 14) wird in Zellen eingeschleust und fOhrt dort zur Bildung von HCV-Viruspartikeln, die 
5 zur Infektion weiterer Zellen verwendet werden kGnnen. Da die Viruspartike! eine RNA mit einem Fremdgen enkapsi- 
diert haben kann dieses in den so infizierten Zeilen zur Produktion des von diesem Fremdgen kodierten Proteins 
benutzt werden. Zellen, die mit dem Konstrukt transfiziert wurden, exprimieren ebenfalls das Fremdgen. 

Beispiel 11: Herstellung von monocistronischen HCV-RNA-Konstrukten, be! denen das Reslstenzgenprodukt 
w als Fusionsproteln mit dem HCV-Anteil exprimiert wird. 

[0085] Fur bestimmte Untersuchungen ist es von Vorteil, wenn das HCV-RNA-Konstrukt kein heterologes IRES- 
Element besitzt Solche Untersuchungen sind beispielsweise die Bestimmung der Interferonresistenz. Wird eine Zelle, 
die ein HCV-RNA-Konstrukt besitzt mit Interferon-alpha Oder -beta inkubiert. kommt es zu einer Reduktion der Repii- 

75 kation der HCV-RNA. Zur AufWSrung des Wirkungsmechanismus ist es notwendig, daB das HCV-RNA-Konstrukt keine 
heterologe IRES besitzt da ansonsten nicht bestimmt werden kann, ob die Interferon -vermittelte Hemmung durch eine 
Hemmung der HCV-Replikation oder durch eine Hemmung der heterologen IRES vermittelt wird. Deshalb werden Kbn- 
strukte hergestellt. bei denen das Resistenzgen mit einem HCV-Protein f usioniert wird (Fig. 1 5). Entweder das Fusions- 
protein ist als solches aktiv oder das Resistenzgenprodukt wird mittels einer proteolytisch spaltbaren 

20 AminosSuresequenz so mit einem HCV-Protein verbunden ist, daB es von einer zelluiaren oder viralen (HCV-)Protease 
von diesem abgespalten wird. 



Tabelle 1 



Spezif ische InfektiositSten (cfu/ug RNA) der HCV-RNA-Konstrukte mit adaptiven Mutationen, die bei der 9-1 3F 
Mutante gefunden und in das parental e HCV-RNA-Konstrukt l 389 /NS3-37wt eingefuhrt wurden 


Aminos&ureaustausch 1 


HCV-Protein 


cfu/^ig RNA 2 


kein 




30 - 60 I 


1283 arg -> gly 


NS3 


200 - 250 


1383 glu -> ala 


NS3 


30-60 


1577 lys-> arg 


NS3 


30 - 60 j 


1609 lys-> glu 


NS3 


160-300 


(1283 arg -> gly + 1383 glu -> ala + 1577 lys -> arg + 1609 lys - 
>glu) 


NS3 


360 - 420 


1936 pro ->ser 


NS4B 


500-1000 


2163 glu -> gly 


NS5A 


1000-5000 


2330 lys -> glu 


NS5A 


30 - 60 


2442 ile -> val 


NS5B 


30-60 


alle zusammen 




5000 



1 Aminosaureaustausch im Polyprotein des HCV-!solats Con-1 (EMBL-Genbank No. AJ 238799); die Aminosauren sind im 
Dreibuchstabenkode angegeben. 

2 Colony forming units (Anzahl der Zellklone) bei einer Selektion von 500^g/ml G418. 
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Tabelle 2 



Spezifische Infekliosrtaten (cfu/jig RNA) des parenta- 
len HCV-RNA-Konstrukts l 389 /NS3-3ywt und der Vari- 
anten 9-13C, 9-131, 9-13F, 5.1 und 19. 


Transfizierte RNA-Vari- 
ante 


cfufog RNA 1 


Wildtyp 


30-50 


9-13 C 


100-1.000 


9-13 1 


100-1.000 


9-13 F 


1.000-10.000 


5.1 


50.000-100.000 


19 


50.000-100.000 



1 Colony forming units (Anzahl der Zellklone) bei einer 
Selekiion von 500ng/ml G418. 



25 



EP 1 043 399 A2 



Tabelle 3: NukJeotid- und Aminosaureunterschiede zwischen dem parental en HCV- 
RNA-Konstrukt I 389 /NS3.3'/wt und den Mutanten 9-131, 9-13F, 5. 1 und 19 



HrV M titan te 


Nukleotidoosition 


Nukleotidaustausch 


Aminosanreaustausc 
h 


9-13 I 


3685 


C>T 


Pro > Leu 




4933 


C>T 


Thr >Met 




5249 


T>C 






8486 


C>T 






8821 


G> A 


Trp > stop 




8991 


C>G 


Arg > Gly 




9203 


A>G 






9313 


T>C 


Phe > Ser 




9346 


T>C 


Val> Ala 


9-13 F 


3866 


C>T 






4188 


A>G 


Arg > Gly 




4489 


A>C 


Ghi> Ala 




4562 


G> A 






4983 


T>C 






5071 


A> G 


Lys > Arg 




5166 


A>G 


Lys > Glu 




6147 


C>T 


Pro > Ser 




6829 


A> G 


Glu > Gly 




7329 


A>G 


Lys > Glu 




7664 


A>G 


IIe>Val 




8486 


C>T 






8991 


C>G 


Arg > Gly 


NK5.1 


4180 


C>T 


Thr > lie 




4679 


C>T 
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4682 


T > C 






5610 


C > A 


L,eu > lie 




6437 


A> G 






6666 


A > G 


Asn ^ ASp 




6842 








6926 


C >T 






6930 


T>C 


Ser > Pro 




7320 


nr 

C > T 


Pro > Ser 




7389 


A > Cj 




NK19 


3946 


A> G 


Glu > Uiy 




4078 


C > G 


Ala > yjiy 




4180 


C > T 


inr > lie 




4682 


T > C 






5610 


C > A 


L-eu > ue 




5958 


A > T 


Met ^ i^eu 




6170 


T > A 






6596 


G> A 






6598 


C > G 


Ala VJty 




OOjj 


r* > t 






6842 


C>T 






6930 


T>C 


Ser > Pro 




7141 


A> G 


Glu>Gly 




7320 


C>T 


Pro > Ser 




7389 


A > G 


Lys > Glu 




7735 


G> A 


Ser > Asn 



[0086] Angegeben sind die Unterschiede der NuWeotid- und Aminosauresequenzen zwischen der Ausgangs-HCV- 
RNA-Sequenz Con 1 (EMBL-Genbank Na AJ238799) und denen der zetlkulturadaptierten HCV-RNAs. Die Zahlen 
beziehen sich auf die NuWeotid- und Aminosaureposrtionen des HCV-lsolats Con1 . 
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SEQUENCE LISTING 

<110> Bartenschlager, Ralf 

<120> Hepatitis C Virus cell culture system 

<130> ba-1 

<140> 199 15 178.4 
<141> 1999-04-03 

<160> 11 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 



<400> 1 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

cgccgcccac 

ttgccgcgca 

caacctcgtg 

gctcagcccg 

ctcctgtcac 

cgcaatttgg 

attccgctcg 

gttctggagg 

ttccttttgg 

gtatccggag 

gcggacatga 

cgctgctggg 

acgatacgac 

gtgggagatc 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatgggcac 
aggacgtcaa 
ggggccccag 
gaaggcgaca 
ggtacccctg 
cccgtggctc 
gtaaggtcat 
tcggcgcccc 
acggcgtgaa 
ctttgctgtc 
tgtaccatgt 
tcatgcatac 
tagcgctcac 
gccatgtcga 
tctgcggatc 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
gaatcctaaa 
gttcccgggc 
gttgggtgtg 
acctatcccc. 
gcccctctat 
tcggcctagt 
cgataccctc 
cctagggggc 
ctatgcaaca 
ctgtttgacc 
cacgaacgac 
ccccgggtgc 
tcccacgctc 
tttgctcgtt 
tgttttcctc 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aa cat eg cat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gecttcttga 
caattccgcc 
ggccggtgtg 
agggecegga 
gecaaaggaa 
tgaagacaaa 
aggtgectet 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accaegggga 
cctcaaagaa 
ggtggtcaga 
cgcgcgacta 
aaggctcgcc 
ggcaatgagg 
tggggcccca 
aegtgegget 
getgecaggg 
gggaatctgc 
atcccagctt 
tgctccaacg 
gtgccctgcg 
gcggccagga 
ggggcggctg 
gtcgcccagc 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
geaggggege 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
geggctgeat 
egagegagea 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgeaaggtet 
caaegtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgetttae 
cgtggttttc 
aaaccaaacg 
tcgtcggtgg 
ggaagacttc 
ageccgaggg 
gcttggggtg 
cggacccccg 
tcgccgatct 
ccctggcgca 
ccggttgctc 
ccgcttatga 
caagcattgt 
ttcgggagaa 
aegctagegt 
ctctctgctc 
tgttcacctt 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gectgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gegeggctat 
actgaagegg 
tctcaccttg 
aegcttgate 
cgtactcgga 
ctcgegccag 
gtcgtgaccc 
ggattcatcg 
accegtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
taacaccaac 
agtttacctg 
egageggteg 
tagggectgg 
ggcaggatgg 
gegrtaggteg 
catggggtac 
tggegtcegg 
cttttctatc 
agtgcgcaac 
gtatgaggca 
caactcctcc 
ccccactacg 
cgctatgtac 
ctcgcctcgc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

B40 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 
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cggcacgaga 
cgtatggctt 
ttactccgga 
gcgggccttg 
ctctttgccg 
ctcgggatta 
aacggcagct 
ttccttgctg 
gccagctgca 
tcacacagct 
gtacccgcgg 
gggacgaccg 
ctgcttctta 
agcactgggt 
aaaaccttga 
tgtggttcgg 
cactacccct 
gagcacaggc 
agggacagat 
tgttccttca 
gtggacgtac 
gagtatgtcc 
atgatgctgc 
gcatccgtgg 
tacatcaagg 
ctcctgctcc 
tcgtgcggag 
ctgttcctcg 
ttgcaagtgt 
acgtgcgcga 
ggtccactca 
gggctcattc 
gctctcatga 
cgggactggg 
tctgatatgg 
atcttgggcc 
agccttgaag 
cgaggcctac 
ggggaggtcc 
gtgtgttgga 
atcacccaaa 
gcgcgttcct 
gccgatgtca 
cccgtctcct 
gtgggcatct 
cccgtcgagt 
ccggccgtac 
agcactaagg 
tccgtcgccg 
aacatcagaa 
ggcaagtttc 
gagtgccact 
gagacggctg 
gtgccacatc 
ggcaaagcca 
aagaagaaat 
tattaccggg 
acggacgctc 
tgtgtcaccc 
gtgccacaag 
ggcatttaca 
ctgtgcgagt 
gttaggttgc 
ttctgggaga 
aagcaggcag 
gctcaggctc 



cagtacagga 
gggatatgat 
tcccacaagc 
cctactattc 
gcgttgacgg 
cgtccctctt 
ggcacatcaa 
cgctgttcta 
gccccatcga 
cggaccagag 
cgcaggtgtg 
accggttcgg 
acaacacgcg 
tcaccaagac 
cctgccccac 
ggccttggtt 
gcactgtcaa 
tcgaagccgc 
cagagcttag 
ccaccctacc 
aatacctgta 
tgttgctctt 
tgatagctca 
ccggggcgca 
gcaggctggt 
tgctggcgtt 
gcgcggtttt 
ctaggctcat 
ggatcccccc 
tccacccaga 
tggtgctcca 
gtgcatgcat 
agttggccgc 
cccacgcggg 
agaccaaggt 
tgcccgtctc 
ggcaggggtg 
ttggctgcat 
aagtggtctc 
ctgtctatca 
tgtacaccaa 
tgacaccatg 
ttccggtgcg 
acttgaaggg 
ttcgggctgc 
ctatggaaac 
cgcagacatt 
tgccggctgc 
ccaccctagg 
ccggggtaag 
ttgccgacgg 
caactgactc 
gagcgcgact 
caaacatcga 
tccccatcga 
gtgatgagct 
gccttgatgt 
taatgacggg 
agacagtcga 
acgcggtgtc 
ggtttgtgac 
gctatgacgc 
gggcttacct 
gcgtctttac 
gagacaactt 
cacctccatc 



ctgcaattgc 
gatgaactgg 
tgtcgtggat 
catggtgggg 
gggaacctat 
ttcacccggg. 
caggactgcc 
cgtgcacaag 
cgcgttcgct 
gccttattgt 
tggtccagtg 
cgtccctacg 
gccgccgcaa 
gtgcgggggc 
ggactgcttc 
gacacccaga 
ctttaccatc 
atgcaattgg 
cccgctgctg 
ggctctgtcc 
cggtataggg 
ccttcttctg 
agctgaggcc 
tggcattctc 
ccctggggcg 
accaccacga 
cgtaggtctg 
atggtggtta 
cctcaacgtt 
gctaatcttt 
ggctggtata 
gctggtgcgg 
actgacaggt 
cctacgagac 
tatcacctgg 
cgcccgcagg 
gcgactcctc 
catcactagc 
caccgcaaca 
tggtgccggc 
tgtggaccag 
cacctgcggc 
ccggcggggc 
ctcttcgggc 
cgtgtgcacc 
cactatgcgg 
ccaggtggcc 
gtatgcagcc 
tttcggggcg 
gaccatcacc 
tggttgctct 
gaccactatc 
cgtcgtgctc 
ggaggtggct 
gaccatcaag 
cgccgcgaag 
atccgtcata 
ctttaccggc 
cttcagcctg 
acgctcgcag 
tccaggagaa 
gggctgtgct 
aaacacacca 
aggcctcacc 
cccctacctg 
gtgggaccaa 



tcaatatatc 
tcacctacag 
atggtggcgg 
aactgggcta 
gtgacagggg 
tcatcccaga 
ctgaactgca 
ttcaactcat 
caggggtggg 
tggcactacg 
tactgcttca 
tacagttggg 
ggcaactggt 
cccccgtgta 
cggaagcacc 
tgcttggtcc 
ttcaaggtta 
actcgaggag 
ctgtctacaa 
actggtttga 
tcggcggttg 
gcggacgcgc 
gccctagaga 
tccttcctcg 
gcatatgccc 
gcatacgcca 
atactcttga 
caatatttta 
cgggggggcc 
accatcacca 
accaaagtgc 
aaggttgctg 
acgtacgttt 
cttgcggtgg 
ggggcagaca 
gggagggaga 
gcgcctatta 
ctcacaggcc 
caatctttcc 
tcaaagaccc 
gacctcgtcg 
agctcggacc 
gacagcaggg 
ggtccactgc 
cgaggggttg 
tccccggtct 
catctacacg 
caagggtata 
tatatgtcta 
acgggtgccc 
gggggcgcct 
ctgggcatcg 
gccaccgcta 
ctgtccagca 
ggggggaggc 
ctgtccggcc 
ccaactagcg 
gatttcgact 
gacccgacct 
cggcgaggca 
cggccctcgg 
tggtacgagc 
gggttgcccg 
cacatagacg 
gtagcatacc 
atgtggaagt 



ccggccacgt 
cagccctagt 
gggcccattg 
aggttctgat 
ggacgatggc 
aaatccagct 
atgactccct 
ctggatgccc 
ggcccatcac 
caccccggcc 
ccccaagccc 
gggagaatga 
ttggctgtac 
acatcggggg 
ccgaggccae 
actacccata 
ggatgtacgt 
agcgttgtaa 
cggagtggca 
tccatctcca 
tctcctttgc 
gcgtctgtgc 
acctggtggt 
tgttcttctg 
tctacggcgt 
tggaccggga 
ccttgtcacc 
tcaccagggc 
gcgatgccgt 
aaatcttgct 
cgtacttcgt 
ggggtcatta 
atgaccatct 
cagttgagcc 
ccgcggcgtg 
tacatctggg 
cggcctactc 
gggacaggaa 
tggcgacctg 
ttgccggccc 
gctggcaagc 
tttacttggt 
ggagcctact 
tctgcccctc 
cgaaggcggt 
tcacggacaa 
cccctactgg 
aggtgcttgt 
aggcacatgg 
ccatcacgta 
atgacatcat 
gcacagtcct 
cgcctccggg 
ctggagaaat 
acctcatttt 
tcggactcaa 
gagacgtcat 
cagtgatcga 
tcaccattga 
ggactggtag 
gcatgttcga 
tcacgcccgc 
tctgccagga 
cccatttctt 
aggctacggt 
gtctcatacg 



gacaggteac 
ggtatcgcag 
gggagtccta 
tgtgatgcta 
caaaaacacc 
tgtaaacacc 
caacactggg 
agagcgcatg 
ttacaatgag 
gtgcggtatc 
tgtcgtggtg 
gacggacgtg 
atggatgaat 
gatcggcaat 
ttacaccaag 
caggctttgg 
ggggggagtg 
cctggaggac 
ggtattgccc 
tcagaacgtc 
aatcaaatgg 
ctgcttgtgg 
cc tea a eg eg 
tgctgcctgg 
atggccgcta 
gatggcagca 
gcactataag 
cgaggcacac 
catcctcctc 
cgccatactc 
gcgcgcacac 
tgtccaaatg 
caccccactg 
cgtcgtcttc 
tggggacatc 
accggcagac 
ccaacagacg 
ccaggtcgag 
cgtcaatggc 
aaagggecca 
gccccccggg 
cacgaggcat 
ctcccccagg 
ggggcacget 
ggactttgta 
ctcgtcccct 
tageggcaag 
cctgaacccg 
tatcgaccct 
ctccacctat 
aatatgtgat 
ggaccaagcg 
atcggtcacc 
ccccttttat 
ctgccattcc 
tgctgtagca 
tgtegtagea 
ctgeaataca 
gacgacgacc 
gggcaggatg 
ttcctcggtt 
cgagacctca 
cca tctggag 
gtcccagact 
gtgegecagg 
getaaagect 



2760 
2620 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
54 60 
5520 
5580 
5640 
5700 
5760 
5820 
5680 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
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acgctgcacg ggccaacgcc cctgctgtat aggctgggag ccgttcaaaa cgaggttact 6720 
accacacacc ccataaccaa atacatcatg gcatgcatgt cggctgacct ggaggtcgtc 6780 
acgagcacct gggtgctggt aggcggagtc ctagcagctc tggccgcgta ttgcctgaca 6840 
acaggcagcg tggtcattgt gggcaggatc atcttgtccg gaaagccggc catcattccc 6900 
gacagggaag tcctttaccg ggagttcgat gagatggaag agtgcgcctc acacctccct 6960 
tacatcgaac agggaatgca gctcgccgaa caattcaaac agaaggcaat cgggttgctg 7020 
caaacagcca ccaagcaagc ggaggctgct gctcccgtgg tggaatccaa gtggcggacc 7080 
ctcgaagcct tctgggcgaa gcatatgtgg aatttcatca gcgggataca atatttagca 7140 
ggcttgtcca ctctgcctgg caaccccgcg atagcatcac tgatggcatt cacagcctct 7200 
atcaccagcc cgctcaccac ccaacatacc ctcctgttta acatcctggg gggatgggtg 7260 
gccgcccaac ttgctcctcc cagegetgct tctgctttcg taggcgccgg catcgctgga 7320 
gcggctgttg gcagcatagg ccttgggaag gtgcttgtgg atattttggc aggttatgga 7380 
gcaggggtgg caggcgcgct cgtggccttt aaggtcatga gcggcgagat gccctccacc 7440 
gaggacetgg ttaacctact ccctgctatc ctctcccctg gcgccctagt cgtcggggtc 7500 
gtgtgcgcag cgatactgcg tcggcacgtg ggcccagggg agggggctgt gcagtggatg 7560 
aaccggctga tagcgttcgc ttcgcggggt aaccacgtct cccccacgca ctatgtgcct 7620 
gagagcgacg ctgcagcacg tgtcactcag atcctctcta .gtcttaccat cactcagctg 7680 
ctgaagaggc ttcaccagtg gatcaacgag gactgctcca cgccatgctc cggctcgtgg 7740 
ctaagagatg tttgggattg gatatgcacg gtgttgactg atttcaagac ctggctccag 7800 
tccaagctcc tgccgcgatt gccgggagtc cccttcttct catgtcaacg tgggtacaag 7860 
ggagtctggc ggggcgacgg catcatgcaa accacctgcc catgtggagc acagatcacc 7920 
ggacatgtga aaaacggttc catgaggatc gtggggccta ggacctgtag taacacgtgg 7980 
catggaacat tccccattaa cgcgtacacc acgggcccct gcacgccctc cccggcgcca 8040 
aattattcta gggcgctgtg gcgggtggct gctgaggagt acgtggaggt tacgcgggtg 8100 
ggggatttcc actacgtgac gggcatgacc actgacaacg taaagtgccc gtgtcaggtt 8160 
ccggcccccg aattcttcac agaagtggat ggggtgcggt tgcacaggta cgctccagcg 8220 
tgcaaacccc tcctacggga ggaggtcaca ttcctggtcg ggctcaatca atacctggtt 8280 
gggtcacagc tcccatgcga gcccgaaccg gacgtagcag tgctcacttc catgctcacc 8340 
gacccctccc acattacggc ggagacggct aagcgtaggc tggccagggg atctcccccc 8400 
tccttggcca gctcatcagc tagccagctg tctgcgcctt ccttgaaggc aacatgcact 8460 
acccgtcatg actccccgga cgctgacctc atcgaggcca acctcctgtg gcggcaggag 8520 
atgggcggga acatcacccg cgtggagtca gaaaataagg tagtaatttt ggactctttc 8580 
gagccgctcc aagcggagga ggatgagagg gaagtatccg ttccggcgga gatcctgcgg 8640 
aggtccagga aattccctcg agcgatgccc atatgggcac gcccggatta caaccctcca 8700 
ctgttagagt cctggaagga cccggactac gtccctccag tggtacacgg gtgtccattg 8760 
ccgcctgcca aggcccctcc gataccacct ccacggagga agaggacggt tgtcctgtca 8820 
gaatctaccg tgtcttctgc cttggcggag ctcgccacaa agaccttcgg cagctccgaa 8880 
tcgtcggccg tcgacagcgg cacggcaacg gcctctcctg accagccctc cgacgacggc 8940 
gacgcgggat ccgacgttga gtcgtactcc tccatgcccc cccttgaggg ggagccgggg 9000 
gatcccgatc tcagcgacgg gtcttggtct accgtaagcg aggaggctag tgaggacgtc 9060 
gtctgctgct cgatgtccta cacatggaca ggcgccctga tcacgccatg cgctgcggag 9120 
gaaaccaagc tgcccatcaa tgcactgagc aactctttgc tccgtcacca caacttggtc 9180 
tatgctacaa catctcgcag cgcaagcctg cggcagaaga aggtcacctt tgacagactg 9240 
caggtcctgg acgaccacta ccgggacgtg ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gttaaggcta aacttctatc cgtggaggaa gcctgtaagc tgacgccccc acattcggcc 9360 
agatctaaat ttggctatgg ggcaaaggac gtccggaacc tatccagcaa ggccgttaac 9420 
cacatccgct ccgtgtggaa ggacttgctg gaagacactg agacaccaat tgacaccacc 9480 
atcatggcaa aaaatgaggt tttctgcgtc caaccagaga aggggggccg caagccagct 9540 
cgccttatcg tattcccaga tttgggggtt cgtgtgtgcg agaaaatggc cctttacgat 9600 
gtggtctcca ccctccctca ggccgtgatg ggctcttcat acggattcca atactctcct 9660 
ggacagcggg tcgagttcct ggtgaatgcc tggaaagcga agaaatgccc tatgggcttc 9720 
gcatatgaca cccgctgttt tgactcaacg gtcactgaga atgacatccg tgttgaggag 9780 
tcaatctacc aatgttgtga cttggccccc gaagccagac aggccataag gtcgctcaca 984 0 
gagcggcttt acatcggggg ccccctgact aattctaaag ggcagaactg cggctatcgc 9900 
cggtgccgcg cgagcggtgt actgacgacc agctgcggta ataccctcac atgttacttg 9960 
aaggccgctg cggcctgtcg agctgcgaag ctccaggact gcacgatgct cgtatgcgga 10020 
gacgaccttg tcgttatctg tgaaagcgcg gggacccaag aggacgaggc gagcctacgg 10080 
gccttcacgg aggctatgac tagatactct gccccccctg gggacccgcc caaaccagaa 10140 
tacgacttgg agttgataac atcatgctcc tccaatgtgt cagtcgcgca cgatgcatct 10200 
ggcaaaaggg tgtactatct cacccgtgac cccaccaccc cccttgcgcg qgctgcgtgg 10260 
gagacagcta gacacactcc agtcaattcc tggctaggca acatcatcat gtatgcgccc 10320 
accttgtggg caaggatgat cctgatgact catttcttct ccatccttct agctcaggaa 10380 
caacttgaaa aagccctaga ttgtcagatc tacggggcct gttactccat tgagccactt 104 40 
gacctacctc agatcattca acgactccat ggccttagcg cattttcact ccatagttac 10500 
tctccaggtg agatcaatag ggtggcttca tgcctcagga aacttggggt accgcccttg 10560 
cgagtctgga gacatcgggc cagaagtgtc cgcgctaggc tactgtccca gggggggagg 10620 
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gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 

ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 10740 

ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctactc 10800 

ctactttctg taggggtagg catctatcta ctccccaacc gatgaacggg gagctaaaca 10860 

ctccaggcca ataggccatc ctgttttttt cccttttttt ttttcttttt tttttttttt 10920 

tttttttttt tttttttttc tccttttttt ttcctctttt tttccttttc tttcctttgg 10980 

tggctccatc ttagccctag tcacggctag ctgtgaaagg tccgtgagcc gcttgactgc 11040 

agagagtgct gatactggcc tctctgcaga tcaagt 11076 
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<210> 2 
<211> 6637 
<212> DNA 

<213> Hepatitis C Virus 
<400> 2 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaaggg cgcgccatga 
cggccgcttg ggtggagagg ctattcggct 
ctgatgccgc cgtgttccgg ctgtcagcgc 
acctgtccgg tgccctgaat gaactgcagg 
cgacgggcgt tccttgcgca gctgtgctcg 
tgctattggg cgaagtgccg gggcaggatc 
aagtatccat catggctgat gcaatgcggc 
cattcgacca ccaagcgaaa catcgcatcg 
ttgtcgatca ggatgatctg gacgaagagc 
ccaggctcaa ggcgcgcatg cccgacggcg 
gcttgccgaa tatcatggtg gaaaatggcc 
tgggtgtggc ggaccgctat caggacatag 
ttggcggcga atgggctgac cgcttcctcg 
agcgcatcgc cttctatcgc cttcttgacg 
gtttccctct agcgggatca attccgcccc 
cgaagccgct tggaataagg ccggtgtgcg 
ccgtcttttg gcaatgtgag ggcccggaaa 
aggggtcttt cccctctcgc caaaggaatg 
gttcctctgg aagcttcttg aagacaaaca 
aaccccccac ctggcgacag gtgcctctgc 
gcaaaggcgg cacaacccca gtgccacgtt 
tggctctcct caagcgtatt caacaagggg 
atgggatctg atctggggcc tcggtgcaca 
aacgtctagg ccccccgaac cacggggacg 
atggaccggg agatggcagc atcgtgcgga 
accttgtcac cgcactataa gctgttcctc 
atcaccaggg ccgaggcaca cttgcaagtg 
cgcgatgccg tcatcctcct cacgtgcgcg 
aaaatcttgc tcgccatact cggtccactc 
ccgtacttcg tgcgcgcaca cgggctcatt 
gggggtcatt atgtccaaat ggctctcatg 
tatgaccatc tcaccccact gcgggactgg 
gcagttgagc ccgtcgtctt ctctgatatg 
accgcggcgt gtggggacat catcttgggc 
atacatctgg gaccggcaga cagccttgaa 
acggcctact cccaacagac gcgaggccta 
cgggacagga accaggtcga gggggaggtc 
ctggcgacct gcgtcaatgg cgtgtgttgg 
cttgccggcc caaagggccc aatcacccaa 
ggctggcaag cgccccccgg ggcgcgttcc 
ctttacttgg tcacgaggca tgccgatgtc 
gggagcctac tctcccccag gcccgtctcc 
ctctgcccct cggggcacgc tgtgggcatc 
gcgaaggcgg tggactttgt acccgtcgag 
ttcacggaca actcgtcccc tccggccgta 
gcccctactg gtagcggcaa gagcactaag 
aaggtgcttg tcctgaaccc gtccgtcgcc 
aaggcacatg gtatcgaccc taacatcaga 
cccatcacgt actccaccta tggcaagttt 
tatgacatca taatatgtga tgagtgccac 
ggcacagtcc tggaccaagc ggagacggct 
acgcctccgg gatcggtcac cgtgccacat 
actggagaaa tcccctttta tggcaaagcc 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ttgaacaaga tggattgcac geaggttctc 420 
atgactgggc acaacagaca atcggctgct 480 
aggggcgccc ggttcttttt gtcaagaccg 540 
acgaggcagc gcggctatcg tggctggcca 600 
acgttgtcac tgaagcggga agggactggc 660 
tcctgtcatc tcaccttgct cctgccgaga 720 
ggctgcatac gcttgatccg gctacctgcc 780 
agcgagcacg tactcggatg gaagccggtc 840 
atcaggggct cgcgccagcc gaactgttcg 900 
aggatctcgt egtgacccat ggcgatgcct 960 
gcttttctgg attcatcgac tgtggccggc 1020 
cgttggctac ccgtgatatt gctgaagagc 1080 
tgctttacgg tatcgccgct cccgattcgc 1140 
agttcttctg agtttaaaca gaccacaacg 1200 
tctccctccc ccccccctaa cgttactggc 1260 
tttgtctata tgttattttc caccatattg 1320 
cctggccctg tcttcttgac gagcattcct 1380 
caaggtctgt tgaatgtcgt gaaggaagca 1440 
acgtctgtag cgaccctttg caggcagcgg 1500 
ggccaaaagc cacgtgtata agatacacct 1560 
gtgagttgga tagttgtgga aagagtcaaa 1620 
ctgaaggatg cccagaaggt accccattgt 1680 
tgctttacat gtgtttagtc gaggttaaaa 1740 
tggttttcct ttgaaaaaca cgataatacc 1800 
ggcgcggttt tcgtaggtct gatactcttg 1860 
gctaggctca tatggtggtt acaatatttt 1920 
tggatccccc ccctcaacgt tcgggggggc 1980 
atccacccag agctaatctt taccatcacc 2040 
atggtgctcc aggctggtat aaccaaagtg 2100 
cgtgcatgca tgctggtgcg gaaggttgct 2160 
aagttggccg cactgacagg tacgtacgtt 2220 
gcccacgcgg gcctacgaga ccttgcggtg 2280 
gagaccaagg ttatcacctg gggggcagac 2340 
ctgcccgtct ccgcccgcag ggggagggag 2400 
gggcaggggt ggcgacfccct cgcgcctatt 2460 
cttggctgca tcatcactag cctcacaggc 2520 
caagtggtct ccaccgcaac acaatctttc 2580 
actgtctatc atggtgccgg ctcaaagacc 2640 
atgtacacca atgtggacca ggacctcgtc 2700 
ttgacaccat gcacctgcgg cagctcggac 2760 
attccggtgc gccggcgggg cgacagcagg 2820 
tacttgaagg gctcttcggg cggtccactg 2880 
tttcgggctg ccgtgtgcac ccgaggggtt 2940 
tctatggaaa ccactatgcg gtccccggtc 3000 
ccgcagacat tccaggtggc ccatctacac 3060 
gtgccggctg cgtatgcagc ccaagggtat 3120 
gccaccctag gtttcggggc gtatatgtct 3180 
accggggtaa ggaccatcac cacgggtgcc 3240 
cttgccgacg gtggttgctc tgggggcgcc 3300 
tcaactgact cgaccactat cctgggcatc 3360 
ggagcgcgac tcgtcgtgct cgccaccgct 3420 
ccaaacatcg aggaggtggc tctgtccagc 3480 
atccccatcg agaccatcaa gggggggagg 3540 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



cacctcattt 
ctcggactca 
ggagacgtca 
tcagtgatcg 
ttcaccattg 
aggactggta 
ggcatgttcg 
ctcacgcccg 
gtctgccagg 
gcccatttct 
caggctacgg 
tgtctcatac 
gccgttcaaa 
tcggctgacc 
ctggccgcgt 
ggaaagccgg 
gagtgcgcct 
cagaaggcaa 
gtggaatcca 
agcgggatac 
ctgatggcat 
aacatcctgg 
gtaggcgccg 
gatattttgg 
agcggcgaga 
ggcgccctag 
gagggggctg 
tcccccacgc 
agtcttacca 
acgccatgct 
gatttcaaga 
tcatgtcaac 
ccatgtggag 
aggacctgta 
tgcacgccct 
tacgtggagg 
gtaaagtgcc 
ttgcacaggt 
gggctcaatc 
gtgctcactt 
ctggccaggg 
tccttgaagg 
aacctcctgt 
gtagtaattt 
gttccggcgg 
cgcccggatt 
gtggtacacg 
aagaggacgg 
aagaccttcg 
gaccagccct 
ccccttgagg 
gaggaggcta 
atcacgccat 
ctccgtca cc 
aaggtcacct 
atgaaggcga 
ctgacgcccc 
otatccagca 
gagacaccaa 
aaggggggcc 
gagaaaatgg 
tacggattcc 
aagaaatgcc 
aatgacatcc 
caggccataa 
gggcagaact 



tctgccattc 
atgctgtagc 
ttgtcgtagc 
actgcaatac 
agacgacgac 
ggggcaggat 
attcctcggt 
ccgagacctc 
accatctgga 
tgtcccagac 
tgtgcgccag 
ggctaaagcc 
acgaggttac 
tggaggtcgt 
attgcctgac 
cca teat tec 
cacacctccc 
tegggttget 
agtggcggac 
aatatttagc 
tcacagcctc 
ggggatgggt 
geategctgg 
caggttatgg 
tgccctccac 
tegteggggt 
tgcagtggat 
actatgtgcc 
tcactcagct 
ccggctcgtg 
cctggctcca 
gtgggtaeaa 
cacagatcac 
gtaacacgtg 
ccccggcgcc 
ttacgcgggt 
cgtgtcaggt 
acgctccagc 
aatacctggt 
ccatgctcac 
gatctccccc 
caacatgcac 
ggcggcagga 
tggactcttt 
agatcctgeg 
acaaccctcc 
ggtgtccatt 
ttgtcctgtc 
gcagctccga 
ccgacgacgg 
gggagccggg 
gtgaggacgt 
gcgctgcgga 
acaacttggt 
ttgacagact 
aggcgtccac 
cacattcggc 
aggccgttaa 
ttga caeca c 
gcaagccagc 
ccctttacga 
aatactctcc 
ctatgggctt 
gtgttgagga 
ggtcgctcac 
geggctateg 



caagaagaaa 
atattacegg 
aaeggacget 
atgtgtcacc 
cgtgccacaa 
gggcatttac 
tctgtgcgag 
agttaggttg 
gttctgggag 
taagcaggca 
ggctcaggct 
tacgctgcac 
taccacacac 
cacgagcacc 
aacaggcagc 
cgacagggaa 
ttacatcgaa 
gcaaacagcc 
cctcgaagcc 
aggcttgtcc 
tatcaccagc 
ggccgcccaa 
agcggctgtt 
agcaggggtg 
cgaggacctg 
cgtgtgcgca 
gaaccggctg 
tgagagegae 
gctgaagagg 
gctaagagat 
gtccaagctc 
gggagtctgg 
cggacatgtg 
gcatggaaca 
aaattattct 
gggggatttc 
tccggccccc 
gtgcaaaccc 
tgggtcacag 
cgacccctcc 
ctccttggcc 
tacccgtcat 
gatgggcggg 
cgagccgctc 
gaggtccagg 
actgttagag 
gccgcctgcc 
agaatctacc 
atcgtcggcc 
egacgeggga 
ggatcccgat 
cgtctgctgc 
ggaaaccaag 
etatgetaca 
gcaggtcctg 
agttaaggct 
cagatctaaa 
ccacatccgc 
catcatggca 
tcgccttatc 
tgtggtctcc 
tggacagegg 
egcatatgae 
gtcaatctac 
agageggett 
ccggtgccgc 



tgtgatgagc 
ggccttgatg 
etaatgaegg 
cagacagtcg 
gacgeggtgt 
aggtttgtga 
tgctatgacg 
cgggcttacc 
agegtcttta 
ggagacaact 
ccacctccat 
gggccaacgc 
cccataacca 
tgggtgctgg 
gtggtcattg 
gtcctttacc 
cagggaatgc 
accaagcaag 
ttctgggcga 
actctgcctg 
ccgctcacca 
cttgctcctc 
ggcagcatag 
gcaggcgcgc 
gttaacctac 
gcgatactgc 
atagegtteg 
gctgcagcac 
cttcaccagt 
gtttgggatt 
ctgccgcgat 
eggggegacg 
aaaaacggtt 
ttccccatta 
agggegctgt 
cactacgtga 
gaattettca 
ctcctacggg 
ctcccatgcg 
cacattaegg 
agctcatcag 
gactccccgg 
aacatcaccc 
caageggagg 
aaattccctc 
tcctggaagg 
aaggcccctc 
gtgtcttctg 
gtcgacagcg 
tccgacgttg 
ctcagcgacg 
tcgatgtcct 
ctgcccatca 
acatctcgca 
gacgaccact 
aaacttctat 
tttggctatg 
tccgtgtgga 
aaaaatgagg 
gtattcccag 
accctccctc 
gtcgagttcc 
acccgctgtt 
caatgttgtg 
tacategggg 
gcgagcggtg 



tcgccgcgaa 
tatcegtcat 
getttacegg 
acttcagcct 
cacgctcgca 
ctccaggaga 
cgggctgtgc 
taaacacacc 
caggcctcac 
tcccctacct 
cgtgggacca 
ccctgctgta 
aatacatcat 
taggeggagt 
tgggcaggat 
gggagttcga 
agctcgccga 
eggaggctge 
agcatatgtg 
gcaaccccgc 
cccaaeatac 
ccagcgctgc 
gccttgggaa 
tcgtggcctt 
tccctgctat 
gtcggcacgt 
ettcgegggg 
gtgtcactca 
ggatcaacga 
ggatatgeae 
tgccgggagt 
geatcatgea 
ccatgaggat 
acgcgtacac 
ggcgggtggc 
egggcatgae 
cagaagtgga 
aggaggtcac 
agcccgaacc 
eggagaegge 
ctagccagct 
acgctgacct 
gcgtggagtc 
aggatgagag 
gagegatgee 
acccggacta 
cgataccacc 
ccttggcgga 
gcacggcaac 
agtegtaetc 
ggtcttggtc 
acacatggac 
atgeactgag 
gcgcaagcct 
acegggaegt 
ccgtggagga 
gggcaaagga 
aggacttget 
ttttctgcgt 
atttgggggt 
aggcegtgat 
tggtgaatgc 
ttgactcaac 
acttggcccc 
gccccctgac 
tactgacgac 



gctgtccggc 
accaactagc 
cgatttcgac 
ggacccgacc 
geggegagge 
acggccctcg 
ttggtacgag 
agggttgece 
ccacatagac 
ggtagcatae 
aatgtggaag 
taggctggga 
ggcatgcatg 
cctagcagct 
catcttgtcc 
tgagatggaa 
acaattcaaa 
tgctcccgtg 
gaatttcatc 
gatagcatca 
cctcctgttt 
ttctgettte 
ggtgcttgtg 
taaggtcatg 
cctctcccct 
gggcccaggg 
taaccacgtc 
gatcctctct 
ggactgctcc 
ggtgttgact 
ccccttcttc 
aaccacctgc 
cgtggggcct 
cacgggcccc 
tgctgaggag 
cactgacaac 
tggggtgcgg 
attcctggtc 
ggaegtagea 
taagegtagg 
gtctgcgcct 
catcgaggcc 
agaaaataag 
ggaagtatcc 
catatgggca 
cgtccctcca 
tecaeggagg 
gctcgccaca 
ggcctctcct 
ctccatgccc 
tacegtaage 
aggcgccctg 
caactctttg 
gcggcagaag 
gctcaaggag 
agcctgtaag 
cgtccggaac 
ggaagacact 
ccaaccagag 
tcgtgtgtgc 
gggctcttca 
ctggaaagcg 
ggtcactgag 
egaagecaga 
taattctaaa 
cagctgeggt 



3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4 560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
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aataccctca catgttactt gaaggccgct gcggcctgtc gagctgcgaa gctccaggac 7560 

tgcacgatgc tcgtatgcgg agacgacctt gtcgttatct gtgaaagcgc ggggacccaa 7 620 

gaggacgagg cgagcctacg ggccttcacg gaggctatga ctagatactc tgccccccct 7 680 

ggggacccgc ccaaaccaga atacgacttg gagttgataa catcatgctc ctccaatgtg 7740 

tcagtcgcgc acgatgcatc tggcaaaagg gtgtactatc tcacccgtga ccccaccacc 7800 

ccccttgcgc gggctgcgtg ggagacagct agacacactc cagtcaattc ctggctaggc 7860 

aacatcatca tgtatgcgcc caccttgtgg gcaaggatga tcctgatgac tcatttcttc 7920 

tccatccttc tagctcagga acaacttgaa aaagccctag attgtcagat ctacggggcc 7980 

tgttactcca ttgagccact tgacctacct cagatcattc aacgactcca tggccttagc 8040 

gcattttcac tccatagtta ctctccaggt gagatcaata gggtggcttc atgcctcagg 8100 

aaacttgggg taccgccctt gcgagtctgg agacatcggg ccagaagtgt ccgcgctagg 8160 

ctactgtccc agggggggag ggctgccact tgtggcaagt acctcttcaa ctgggcagta 8220 

aggaccaagc tcaaactcac tccaatcccg gctgcgtccc agttggattt atccagctgg 8280 

ttcgttgctg gttacagcgg gggagacata tatcacagcc tgtctcgtgc ccgaccccgc 8340 

tggttcatgt ggtgcctact cctactttct gtaggggtag gcatctatct actccccaac 8400 

cgatgaacgg ggagctaaac actccaggcc aataggccat cctgtttttt tccctttttt 8460 

tttttctttt tttttttttt tttttttttt tttttttttt ctcctttttt tttcctcttt 8520 

ttttcctttt ctttcctttg gtggctccat cttagcccta gtcacggcta gctgtgaaag 8580 

gtccgtgagc cgcttgactg cagagagtgc tgatactggc ctctctgcag atcaagt 8637 
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<210> 3 
<211> 800X 
<212> DKA 

<213> Hepatitis C Virus 
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<400> 3 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

tgcatcatca 

gtctccaccg 

tatcatggtg 

accaatgtgg 

ccatgcacct 

gtgcgccggc 

aagggctctt 

gctgccgtgt 

gaaaccacta 

acattccagg 

gctgcgtatg 

ctaggtttcg 

gtaaggacca 

gacggtggtt 

gactcgacca 

cgactcgtcg 

atcgaggagg 

atcgagacca 

gagctcgccg 

gatgtatccg 

acgggcttta 

gtcgacttca 

gtgtcacgct 

gtgactccag 

gacgcgggct 

tacctaaaca 

tttacaggcc 

aacttcccct 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatggcgcc 
ctagcctcac 
caacacaatc 
ccggctcaaa 
accaggacct 
gcggcagctc 
ggggcgacag 
cgggcggtcc 
gcacccgagg 
tgcggtcccc 
tggcccatct 
cagcccaagg 
gggcgtatat 
tcaccacggg 
gctctggggg 
ctatcctggg 
tgctcgccac 
tggctctgtc 
tcaagggggg 
cgaagctgtc 
tcataccaac 
ccggcgattt 
gcctggaccc 
cgcagcggcg 
gagaacggcc 
gtgcttggta 
caccagggtt 
tcacccacat 
acctggtagc 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
tattacggcc 
aggccgggac 
tttcctggcg 
gacccttgcc 
cgtcggctgg 
ggacctttac 
cagggggagc 
actgctctgc 
ggttgcgaag 
ggtcttcacg 
acacgcccct 
gtataaggtg 
gtctaaggca 
tgcccccatc 
cgcctatgac 
catcggcaca 
cgctacgcct 
cagcactgga 
gaggcacctc 
cggcctcgga 
tagcggagac 
cgactcagtg 
gaccttcacc 
aggcaggact 
ctcgggcatg 
cgagctcacg 
gcccgtctgc 
agacgcccat 
ataecaggct 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacgggga 
tactcccaac 
aggaaccagg 
acctgcgtca 
ggcccaaagg 
caagcgcccc 
ttggtcacga 
ctactctccc 
ccctcggggc 
gcggtggact 
gacaactcgt 
actggtagcg 
cttgtcctga 
catggtatcg 
acgtactcca 
atcataatat 
gtcctggacc 
ccgggatcgg 
gaaatcccct 
attttctgcc 
ctcaatgctg 
gtcattgtcg 
atcgactgca 
attgagacga 
ggtaggggca 
ttcgattcct 
cccgccgaga 
caggaccatc 
ttcttgtccc 
acggtgtgcg 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
agacgcgagg 
tcgaggggga 
atggcgtgtg 
gcccaatcac 
ccggggcgcg 
ggcatgccga 
ccaggcccgt 
acgctgtggg 
ttgtacccgt 
cccctccggc 
gcaagagcac 
acccgtccgt 
accctaacat 
cctatggcaa 
gtgatgagtg 
aagcggagac 
tcaccgtgcc 
tttatggcaa 
attccaagaa 
tagcatatta 
tagcaacgga 
atacatgtgt 
cgaccgtgcc 
ggatgggcat 
cggttctgtg 
cctcagttag 
tggagttctg 
agactaagca 
ccagggctca 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ceggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
cctacttggc 
ggtccaagtg 
ttggactgtc 
ccaaatgtac 
ttccttgaca 
tgtcattccg 
ctcctacttg 
catctttcgg 
cgagtctatg 
cgtaccgcag 
taaggtgccg 
cgccgccacc 
cagaaccggg 
gtttcttgcc 
ccactcaact 
ggctggagcg 
acatccaaac 
agccatcccc 
gaaatgtgat 
ccggggcctt 
cgctctaatg 
cacccagaca 
acaagacgcg 
ttacaggttt 
cgagtgctat 
gttgcgggct 
ggagagcgtc 
ggcaggagac 
ggctccacct 



60 

120 

160 

240 

300 

360 

420 

460 

540 

600 

660 

720 

760 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1600 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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ccatcgtggg accaaatgtg gaagtgtctc 
acgcccctgc tgtataggct gggagccgtt 
accaaataca tcatggcatg catgtcggct 
ctggtaggcg gagtcctagc agctctggcc 
attgtgggca ggatcatctt gtccggaaag 
taccgggagt tcgatgagat ggaagagtgc 
atgcagctcg ccgaacaatt caaacagaag 
caagcggagg ctgctgctcc cgtggtggaa 
gcgaagcata tgtggaattt catcagcggg 
cctggcaacc ccgcgatagc atcactgatg 
accacccaac ataccctcct gtttaacatc 
cctcccagcg ctgcttctgc tttcgfcaggc 
ataggccttg ggaaggtgct tgtggatatt 
gcgctcgtgg cctttaaggt catgagcggc 
ctactccctg ctatcctctc ccctggcgcc 
ctgcgtcggc acgtgggccc aggggagggg 
ttcgcttcgc ggggtaacca cgtctccccc 
gcacgtgtca ctcagatcct ctctagtctt 
cagtggatca acgaggactg ctccacgcca 
gattggatat gcacggtgtt gactgatttc 
cgattgccgg gagtcccctt cttctcatgt 
gacggcatca tgcaaaccac ctgcccatgt 
ggttccatga ggatcgtggg gcctaggacc 
attaacgcgt acaccacggg cccctgcacg 
ctgtggcggg tggctgctga ggagtacgtg 
gtgacgggca tgaccactga caacgtaaag 
ttcacagaag tggatggggt gcggttgcac 
cgggaggagg tcacattcct ggtcgggctc 
tgcgagcccg aaccggacgt agcagtgctc 
acggcggaga cggctaagcg taggctggcc 
tcagctagcc agctgtctgc gccttccttg 
ccggacgctg acctcatcga ggccaacctc 
acccgcgtgg agtcagaaaa taaggtagta 
gaggaggat-g agagggaagt atccgttccg 
cctcgagcga tgcccatatg ggcacgcccg 
aaggacccgg actacgtccc tccagtggta 
cctccgatac cacctccacg gaggaagagg 
tctgccttgg cggagctcgc cacaaagacc 
agcggcacgg caacggcctc tcctgaccag 
gttgagtcgt actcctccat gccccccctt 
gacgggtctt ggtctaccgt aagcgaggag 
tcctacacat ggacaggcgc cctgatcacg 
atcaatgcac tgagcaactc tttgctccgt 
cgcagcgcaa gcctgcggca gaagaaggtc 
cactaccggg acgtgctcaa ggagatgaag 
ctatccgtgg aggaagcctg taagctgacg 
tatggggcaa aggacgtccg gaacctatcc 
tggaaggact tgctggaaga cactgagaca 
gaggttttct gcgtccaacc agagaagggg 
ccagatttgg gggttcgtgt gtgcgagaaa 
cctcaggccg tgatgggctc ttcatacgga 
ttcctggtga atgcctggaa agcgaagaaa 
tgttttgact caacggtcac tgagaatgac 
tgtgacttgg cccccgaagc cagacaggcc 
gggggccccc tgactaattc taaagggcag 
ggtgtactga cgaccagctg cggtaatacc 
tgtcgagctg cgaagctcca ggactgcacg 
atctgtgaaa gcgcggggac ccaagaggac 
atgactagat actctgcccc ccctggggac 
ataacatcat gctcctccaa tgtgtcagtc 
tatctcaccc gtgaccccac cacccccctt 
actccagtca attcctggct aggcaacatc 
atgatcctga tgactcattt cttctccatc 
ctagattgtc agatctacgg ggcctgttac 
attcaacgac tccatggcct tagcgcattt 
aatagggtgg cttcatgcct caggaaactt 



atacggctaa agcctacgct gcacgggcca 3600 
caaaacgagg ttactaccac acaccccata 3660 
gacctggagg tcgtcacgag cacctgggtg 3720 
gcgtattgcc tgacaacagg cagcgtggtc 3780 
ccggccatca ttcccgacag ggaagtcctt 3840 
gcctcacacc tcccttacat cgaacaggga 3900 
gcaatcgggt tgctgcaaac agccaccaag 3960 
tccaagtggc ggac cc tcga agccttctgg 4020 
atacaatatt tagcaggctt gtccactctg 4080 
gcattcacag cctctatcac cagcccgctc 4X40 
ctggggggat gggtggccgc ccaacttgct 4200 
gccggcatcg ctggagcggc tgttggcagc 4260 
ttggcaggtt atggagcagg ggtggcaggc 4320 
gagatgccct ccaccgagga cctggttaac 4380 
ctagtcgtcg gggtcgtgtg cgcagcgata 4440 
gctgtgcagt ggatgaaccg gctgatagcg 4500 
acgcactatg tgcctgagag cgacgctgca 4560 
accatcactc agctgctgaa gaggcttcac 4620 
tgctccggct cgtggctaag agatgtttgg 4680 
aagacctggc tccagtccaa gctcctgccg 4740 
caacgtgggt acaagggagt ctggcggggc 4800 
ggagcacaga tcaccggaca tgtgaaaaac 4860 
tgtagtaaca cgtggcatgg aacattcccc 4920 
ccctccccgg cgccaaatta ttctagggcg 4980 
gaggttacgc gggtggggga tttccactac 5040 
tgcccgtgtc aggttccggc ccccgaattc 5100 
aggtacgctc cagcgtgcaa acccctccta 5160 
aatcaatacc tggttgggtc acagctccca 5220 
acttccatgc tcaccgaccc ctcccacatt 528 0 
aggggatctc ccccctcctt ggccagctca 5340 
aaggcaacat gcactacccg tcatgactcc 5400 
ctgtggcggc aggagatggg cgggaacatc 54 60 
attttggact ctttcgagcc gctccaagcg 5520 
gcggagatcc tgcggaggtc caggaaattc 5580 
gattacaacc ctccactgtt agagtcctgg 5640 
cacgggtgtc cattgccgcc tgccaaggcc 5700 
acggttgtcc tgtcagaatc taccgtgtct 5760 
ttcggcagct ccgaatcgtc ggccgtcgac 5820 
ccctccgacg acggcgacgc gggatccgac 5880 
gagggggagc cgggggatcc cgatctcagc 5940 
gctagtgagg acgtcgtctg ctgctcgatg 6000 
ccatgcgctg cggaggaaac caagctgccc 6060 
caeca caact tggtctatgc tacaacatct 6120 
acctttgaca gaetgeaggt cctggacgac 6180 
gcgaaggcgt ccacagttaa ggctaaactt 624 0 
cccccacatt cggccagatc taaatttggc 6300 
ageaaggecg ttaaccacat ccgctccgtg 6360 
ccaattgaca ccaccatcat ggcaaaaaat 6420 
ggccgcaagc cagctcgcct tategtatte 6480 
atggcccttt acgatgtggt ctccaccctc 6540 
ttccaatact ctcctggaca gegggtcgag 6600 
tgccctatgg gettegcata tgacacccgc 6660 
atccgtgttg aggagtcaat ctaccaatgt 6720 
ataaggtege teacagageg gctttacatc 6780 
aactgegget ategceggtg ccgcgcgagc 6840 
ctcacatgtt acttgaaggc cgctgcggcc 6900 
at get eg tat geggagaega ccttgtcgtt 6960 
gaggegagee taegggcett caeggagget 7020 
ccgcccaaac cagaatacga cttggagttg 7080 
gcgcacgatg catctggcaa aagggtgtac 7140 
gcgcgggctg cgtgggagac agctagacac 7200 
atcatgtatg cgcccacctt gtgggcaagg 7260 
cttctagctc aggaacaact tgaaaaagee 7320 
tccattgagc cacttgacct acctcagatc 7380 
tcactccata gttactctcc aggtgagatc 744 0 
ggggtacege ecttgegagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 768 0 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 

8001 
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<210> 4 
<211> 7969 
<212> DNA 

<213> Hepatitis C Virus 
<400> 4 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaaggg cgcgccatga 
cggccgcttg ggtggagagg ctattcggct 
ctgatgccgc cgtgttccgg ctgtcagcgc 
acctgtccgg tgccctgaat gaactgcagg 
cgacgggcgt tccttgcgca gctgtgctcg 
tgctattggg cgaagtgccg gggcaggatc 
aagtatccat catggctgat gcaatgcggc 
cattcgacca ccaagcgaaa catcgcatcg 
ttgtcgatca ggatgatctg gacgaagagc 
ccaggctcaa ggcgcgcatg cccgacggcg 
gcttgccgaa tatcatggtg gaaaatggcc 
tgggtgtggc ggaccgctat caggacatag 
ttggcggcga atgggctgac cgcttcctcg 
agcgcatcgc cttctatcgc cttcttgacg 
gtttccctct agcgggatca attccgcccc 
cgaagccgct tggaataagg ccggtgtgcg 
ccgtcttttg gcaatgtgag ggcccggaaa 
aggggtcttt cccctctcgc caaaggaatg 
gttcctctgg aagcttcttg aagacaaaca 
aaccccccac ctggcgacag gtgcctctgc 
gcaaaggcgg cacaacccca gtgccacgtt 
tggctctcct caagcgtatt caacaagggg 
atgggatctg atctggggcc tcggtgcaca 
aacgtctagg ccccccgaac cacggggacg 
atggcgccta ttacggccta ctcccaacag 
agcctcacag gccgggacag gaaccaggtc 
acacaatctt tcctggcgac ctgcgtcaat 
ggctcaaaga cccttgccgg cccaaagggc 
caggacctcg tcggctggca agcgcccccc 
ggcagctcgg acctttactt ggtcacgagg 
ggcgacagca gggggagcct actctccccc 
ggcggtccac tgctctgccc ctcggggcac 
acccgagggg ttgcgaaggc ggtggacttt 
cggtccccgg tcttcacgga caactcgtcc 
gcccatctac acgcccctac tggtagcggc 
gcccaagggt ataaggtgct tgtcctgaac 
gcgtatatgt ctaaggcaca tggtatcgac 
accacgggtg cccccatcac gtactccacc 
tctgggggcg cctatgacat cataatatgt 
atcctgggca tcggcacagt cctggaccaa 
ctcgccaccg ctacgcctcc gggatcggtc 
gctctgtcca gcactggaga aatccccttt 
aaggggggga ggcacctcat tttctgccat 
aagctgtccg gcctcggact caatgctgta 
ataccaacta gcggagacgt cattgtcgta 
ggcgatttcg actcagtgat cgactgcaat 
ctggacccga ccttcaccat tgagacgacg 
cagcggcgag gcaggactgg taggggcagg 
gaacggccct cgggcatgtt cgattcctcg 
gcttggtacg agctcacgcc cgccgagacc 
ccagggttgc ccgtctgcca ggaccatctg 
acccacatag acgcccattt cttgtcccag 
ctggtagcat accaggctac ggtgtgcgcc 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 160 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ttgaacaaga tggattgcac gcaggttctc 420 
atgactgggc acaacagaca atcggctgct 460 
aggggcgccc ggttcttttt gtcaagaccg 540 
acgaggcagc gcggctatcg tggctggcca 600 
acgttgtcac tgaagcggga agggactggc 660 
tcctgtcatc tcaccttgct cctgccgaga 720 
ggctgcatac gcttgatccg gctacctgcc 760 
agcgagcacg tactcggatg gaagccggtc 840 
atcaggggct cgcgccagcc gaactgttcg 900 
aggatctcgt cgtgacccat ggcgatgcct 960 
gcttttctgg attcatcgac tgtggccggc 1020 
cgttggctac ccgtgatatt gctgaagagc 1080 
tgctttacgg tatcgccgct ccegattcgc 1140 
agttcttctg agtttaaaca gaccacaacg 1200 
tctccctccc ccccccctaa cgttactggc 1260 
tttgtctata tgttattttc caccatattg 1320 
cctggccctg tcttcttgac gagcattcct 1380 
caaggtctgt tgaatgtcgt gaaggaagca 1440 
acgtctgtag cgaccctttg caggcagcgg 1500 
ggccaaaagc cacgtgtata agatacacct 1560 
gtgagttgga tagttgtgga aagagtcaaa 1620 
ctgaaggatg cccagaaggt accccattgt 1680 
tgctttacat gtgtttagtc gaggttaaaa 1740 
tggttttcct ttgaaaaaca cgataatacc 1800 
acgcgaggcc tacttggctg catcatcact 1860 
gagggggagg tccaagtggt ctccaccgca 1920 
ggcgtgtgtt ggactgtcta tcatggtgcc 1980 
ccaatcaccc aaatgtacac caatgtggac 2040 
ggggcgcgtt ccttgacacc atgcacctgc 2100 
catgccgatg tcattccggt gcgccggcgg 2160 
aggcccgtct cctacttgaa gggctcttcg 2220 
gctgtgggca tctttcgggc tgccgtgtgc 2280 
gtacccgtcg agtctatgga aaccactatg 2340 
cctccggccg taccgcagac attccaggtg 2400 
aagagcacta aggtgccggc tgcgtatgca 2460 
ccgtccgtcg ccgccaccct aggtttcggg 2520 
cctaacatca gaaccggggt aaggaccatc 2580 
tatggcaagt ttcttgccga cggtggttgc 2640 
gatgagtgcc actcaactga ctcgaccact 2700 
gcggagacgg ctggagcgcg actcgtcgtg 2760 
accgtgccac atccaaacat cgaggaggtg 2820 
tatggcaaag ccatccccat cgagaccatc 2880 
tccaagaaga aatgtgatga gctcgccgcg 2940 
gcatattacc ggggccttga tgtatccgtc 3000 
gcaacggacg ctctaatgac gggctttacc 3060 
acatgtgtca cccagacagt cgacttcagc 3120 
accgtgccac aagacgcggt gtcacgctcg 3160 
atgggcattt acaggtttgt gactccagga 3240 
gttctgtgcg agtgctatga cgcgggctgt 3300 
tcagttaggt tgcgggctta cctaaacaca 3360 
gagttctggg agagcgtctt tacaggcctc 3420 
actaagcagg caggagacaa cttcccctac 3480 
agggctcagg ctccacctcc atcgtgggac 3540 
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caaatgtgga agtgtctcat acggctaaag cctacgctgc acgggccaac gcccctgctg 3600 
tataggctgg gagccgttca aaacgaggtt actaccacac accccataac caaatacatc 3660 
atggcatgca tgtcggctga cctggaggtc gtcacgagca cctgggtgct ggtaggcgga 3*720 
gtcctagcag ctctggccgc gtattgcctg acaacaggca gcgtggtcat tgtgggcagg 3780 
atcatcttgt ccggaaagcc ggccatcatt cccgacaggg aagtccttta ccgggagttc 384 0 
gatgagatgg aagagtgcgc ctcacacctc ccttacatcg aacagggaat gcagctcgcc 3900 
gaacaattca aacagaaggc aatcgggttg ctgcaaacag ccaccaagca agcggaggct 3960 
gctgctcccg tggtggaatc caagtggcgg accctcgaag ccttctgggc gaagcatatg 4020 
tggaatttca tcagcgggat acaatattta gcaggcttgt ccactctgcc tggcaacccc 4080 
gcgatagcat cactgatggc attcacagcc tctatcacca gcccgctcac cacccaacat 4140 
accctcctgt ttaacatcct ggggggatgg gtggccgccc aacttgctcc tcccagcgct 4200 
gcttctgctt tcgtaggcgc cggcatcgct ggagcggctg ttggcagcat aggccttggg 4260 
aaggtgcttg tggatatttt ggcaggttat ggagcagggg tggcaggcgc gctcgtggcc 4320 
tttaaggtca tgagcggcga gatgccctcc accgaggacc tggttaacct actccctgct 4380 
atcctctccc ctggcgccct agtcgtcggg gtcgtgtgcg cagcgatact gcgtcggcac 4440 
gtgggcccag gggagggggc tgtgcagtgg atgaaccggc tgatagcgtt cgcttcgcgg 4500 
ggtaaccacg tctcccccac gcactatgtg cctgagagcg acgctgcagc acgtgtcact 4560 
cagatcctct ctagtcttac catcactcag ctgctgaaga ggcttcacca gtggatcaac 4620 
gaggactgct ccacgccatg ctccggctcg tggctaagag atgtttggga ttggatatgc 4 680 
acggtgttga ctgatttcaa gacctggctc cagtccaagc tcctgccgcg attgccggga 4740 
gtccccttct tctcatgtca acgtgggtac aagggagtct ggcggggcga cggcatcatg 4 800 
caaaccacct gcccatgtgg agcacagatc accggacatg tgaaaaacgg ttccatgagg 4860 
atcgtggggc ctaggacctg tagtaacacg tggcatggaa cattccccat taacgcgtac 4920 
accacgggcc cctgcacgcc ctccccggcg ccaaattatt ctagggcgct gtggcgggtg 4980 
gctgctgagg agtacgtgga ggttacgcgg gtgggggatt tccactacgt gacgggcatg 5040 
accactgaca acgtaaagtg cccgtgtcag gttccggccc ccgaattctt cacagaagtg 5100 
gatggggtgc ggttgcacag gtacgctcca gcgtgcaaac ccctcctacg ggaggaggtc 5160 
aeattcctgg tcgggctcaa tcaatacctg gttgggtcac agctcccatg cgagcccgaa 5220 
ccggacgtag cagtgctcac ttccatgctc accgacccct cccacattac ggcggagacg 5280 
gctaagcgta ggctggccag gggatctccc ccctccttgg ccagctcatc agctagccag 5340 
ctgtctgcgc cttccttgaa ggcaacatgc actacccgtc atgactcccc ggacgctgac 5400 
ctcatcgagg ccaacctcct gtggcggcag gagatgggcg ggaacatcac ccgcgtggag 5460 
tcagaaaata aggtagtaat tttggactct ttcgagccgc tccaagcgga ggaggatgag 5520 
agggaagtat ccgttccggc ggagatcctg cggaggtcca ggaaattccc tcgagcgatg 5580 
cccatatggg cacgcccgga ttacaaccct ccactgttag agtcctggaa ggacccggac 564 0 
tacgtccctc cagtggtaca cgggtgtcca ttgccgcctg ccaaggcccc tccgatacca 5700 
cctccacgga ggaagaggac ggttgtcctg tcagaatcta ccgtgtcttc tgccttggcg 5760 
gagctcgcca caaagacctt cggcagctcc gaatcgtcgg ccgtcgacag cggcacggca 5820 
acggcctctc ctgaccagcc ctccgacgac ggcgacgcgg gatccgacgt tgagtcgtac 5880 
tcctccatgc ccccccttga gggggagccg ggggatcccg atctcagcga cgggtcttgg 5940 
tctaccgtaa gcgaggaggc tagtgaggac gtcgtctgct gctcgatgtc ctacacatgg 6000 
acaggcgccc tgatcacgcc atgcgctgcg gaggaaacca agctgcccat caatgcactg 6060 
agcaactctt tgctccgtca ccacaacttg gtctatgcta caacatctcg cagcgcaagc 6120 
ctgcggcaga agaaggtcac ctttgacaga ctgcaggtcc tggacgacca ctaccgggac 6180 
gtgctcaagg agatgaaggc gaaggcgtcc acagttaagg ctaaacttct atccgtggag 6240 
gaagcctgta agctgacgcc cccacattcg gccagatcta aatttggcta tggggcaaag 6300 
gacgtccgga acctatccag caaggccgtt aaccacatcc gctccgtgtg gaaggacttg 6360 
ctggaagaca ctgagacacc aattgacacc accatcatgg caaaaaatga ggttttctgc 6420 
gtccaaccag agaagggggg ccgcaagcca gctcgcctta tcgtattccc agatttgggg 6480 
gttcgtgtgt gcgagaaaat ggccctttac gatgtggtct ccaccctccc tcaggccgtg 6540 
atgggctctt catacggatt ccaatactct cctggacagc gggtcgagtt cctggtgaat 6600 
gcctggaaag cgaagaaatg ccctatgggc ttcgcatatg acacccgctg ttttgactca 6660 
acggtcactg agaatgacat ccgtgttgag gagtcaatct accaatgttg tgacttggcc 6720 
cccgaagcca gacaggccat aaggtcgctc acagagcggc tttacatcgg gggccccctg 67 80 
actaattcta aagggcagaa ctgcggctat cgccggtgcc gcgcgagcgg tgtactgacg 6840 
accagctgcg gtaataccct cacatgttac ttgaaggccg ctgcggcctg tcgagctgcg 6900 
aagctccagg actgcacgat gctcgtatgc ggagacgacc ttgtcgttat ctgtgaaagc 6960 
gcggggaccc aagaggacga ggcgagccta cgggccttca cggaggctat gactagatac 7020 
tctgcccccc ctggggaccc gcccaaacca gaatacgact tggagttgat aacatcatgc 7080 
tcctccaatg tgtcagtcgc gcacgatgca tctggcaaaa gggtgtacta tctcacccgt 7140 
gaccccacca ccccccttgc gcgggctgcg tgggagacag ctagacacac tccagtcaat 7200 
tcctggctag gcaacatcat catgtatgcg cccaccttgt gggcaaggat gatcctgatg 7260 
actcatttct tctccatcct tctagctcag gaacaacttg aaaaagccct agattgtcag 7320 
atctacgggg cctgttactc cattgagcca cttgacctac ctcagatcat tcaacgactc 7380 
catggcctta gcgcattttc actccatagt tactctccag gtgagatcaa tagggtggct 7440 
tcatgcctca ggaaacttgg ggtaccgccc ttgcgagtct ggagacatcg ggccagaagt 7500 
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gtccgcgcta ggctactgtc ccaggggggg 
aactgggcag taaggaccaa gctcaaactc 
ttatccagct ggttcgttgc tggttacagc 
gcccgacccc gctggttcat gtggtgccta 
ctactcccca accgatgaac ggggagctaa 
tttccctttt tttttttctt tttttttttt 
tttttcctct ttttttcctt ttctttcctt 
tagctgtgaa aggtccgtga gccgcttgac 
agatcaagt 



agggctgcca cttgtggcaa gtacctcttc 7560 
actccaatcc cggctgcgtc ccagttggat 7620 
gggggagaca tatatcacag cctgtctcgt 7680 
ctcctacttt ctgtaggggt aggcatctat 7740 
acactccagg ccaataggcc atcctgtttt 7800 
tttttttttt tttttttttt ttctcctttt 7860 
tggtggctcc atcttagccc tagtcacggc 7920 
tgcagagagt gctgatactg gcctctctgc 7980 

7989 
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<210> 5 
<211> B649 
<Z12> DNA 

<213> Hepatitis C Virus 
<400> 5 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatggaccg ggagatggca 
ctgatactct tgaccttgtc accgcactat 
ttacaatatt ttatcaccag ggccgaggca 
gttcgggggg gccgcgatgc cgtcatcctc 
tttaccatca ccaaaatctt gctcgccata 
ataaccaaag tgccgtactt cgtgcgcgca 
cggaaggttg ctgggggtca ttatgtccaa 
ggtacgtacg tttatgacca tctcacccca 
gaccttgcgg tggcagttga gcccgtcgtc 
tggggggcag acaccgcggc gtgtggggac 
agggggaggg agatacatct gggaccggca 
ctcgcgccta ttacggccta ctcccaacag 
agcctcacag gccgggacag gaaccaggtc 
acacaatctt tcctggcgac ctgcgtcaat 
ggctcaaaga cccttgccgg cccaaagggc 
caggacctcg tcggctggca agcgcccccc 
ggcagctcgg acctttactt ggtcacgagg 
ggcgacagca gggggagcct actctccccc 
ggcggtccac tgctctgccc ctcggggcac 
acccgagggg ttgcgaaggc ggtggacttt 
cggtccccgg tcttcacgga caactcgtcc 
gcccatctac acgcccctac tggtagcggc 
gcccaagggt ataaggtgct tgtcctgaac 
gcgtatatgt ctaaggcaca tggtatcgac 
accacgggtg cccccatcac gtactccacc 
tctgggggcg cctatgacat cataatatgt 
atcctgggca tcggcacagt cctggaccaa 
ctcgccaccg ctacgcctcc gggatcggtc 
gctctgtcca gcactggaga aatccccttt 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 480 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgcg gcggctgcat acgcttgatc 780 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1800 
gcatcgtgeg gaggcgcggt tttcgtaggt 1860 
aagctgttcc tcgctaggct catatggtgg 1920 
cacttgcaag tgtggatccc ccccctcaac 1980 
ctcacgtgcg cgatccaccc agagctaatc 2040 
ctcggtccac tcatggtgct ccaggctggt 2100 
cacgggctca ttcgtgcatg catgctggtg 2160 
atggctctca tgaagttggc cgcactgaca 2220 
ctgcgggact gggcccacgc gggcctacga 2280 
ttctctgata tggagaccaa ggttatcacc 2340 
atcatcttgg gcctgcccgt ctccgcccgc 2400 
gacagccttg aagggcaggg gtggcgactc 24 60 
acgcgaggcc tacttggctg catcatcact 2520 
gagggggagg tccaagtggt ctccaccgca 2580 
ggcgtgtgtt ggactgtcta tcatggtgcc 2640 
ccaatcaccc aaatgtacac caatgtggac 2700 
ggggcgcgtt ccttgacacc atgcacctgc 2760 
catgccgatg tcattccggt gcgccggcgg 2820 
aggcccgtct cctacttgaa gggctcttcg 28 80 
gctgtgggca tctttcgggc tgccgtgtgc 2940 
gtacccgtcg agtctatgga aaccactatg 3000 
cctccggccg taccgcagac attccaggtg 3060 
aagagcacta aggtgccggc tgcgtatgca 3120 
ccgtccgtcg ccgccaccct aggtttcggg 3180 
cctaacatca gaaccggggt aaggaccatc 3240 
tatggcaagt ttcttgccga cggtggttgc 3300 
gatgagtgcc actcaactga ctcgaccact 3360 
gcggagacgg ctggagcgcg actcgtcgtg 3420 
accgtgccac atccaaacat cgaggaggtg 3480 
tatggcaaag ccatccccat cgagaccatc 3540 
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aaggggggga ggcacctcat tttctgccat 
aagctgtccg gcctcggact caatgctgta 
ataccaacta gcggagacgt cattgtcgta 
ggcgatttcg actcagtgat cgactgcaat 
ctggacccga ccttcaccat tgagacgacg 
cagcggcgag gcaggactgg taggggcagg 
gaacggccct cgggcatgtt cgattcctcg 
gcttggtacg agctcacgcc cgccgagacc 
ccagggttgc ccgtctgcca ggaccatctg 
acccacatag acgcccattt cttgtcccag 
ctggtagcat accaggctac ggtgtgcgcc 
caaatgtgga agtgtctcat acggctaaag 
tataggctgg gagccgttca aaacgaggtt 
atggcatgca tgtcggctga cctggaggtc 
gtcctagcag ctctggccgc gtattgcctg 
atcatcttgt ccggaaagcc ggccatcatt 
gatgagatgg aagagtgcgc ctcacacctc 
gaacaattca aacagaaggc aatcgggttg 
gctgctcccg tggtggaatc caagtggcgg 
tggaatttca tcagcgggat acaatattta 
gcgatagcat cactgatggc attcacagcc 
accctcctgt ttaacatcct ggggggatgg 
gcttctgctt tcgtaggcgc cggcatcgct 
aaggtgcttg tggatatttt ggcaggttat 
tttaaggtca tgagcggcga gatgccctce 
atcctctccc ctggcgccct agtcgtcggg 
gtgggcccag gggagggggc tgtgcagtgg 
ggtaaccacg tctcccccac gcactatgtg 
cagatcctct ctagtcttac catcactcag 
gaggactgct ccacgccatg ctccggctcg 
acggtgttga ctgatttcaa gacctggctc 
gtccccttct tctcatgtca acgtgggtac 
caaaccacct gcccatgtgg agcacagatc 
atcgtggggc ctaggacctg tagtaacacg 
accacgggcc cctgcacgcc ctccccggcg 
gctgctgagg agtacgtgga ggttacgcgg 
accactgaca acgtaaagtg cccgtgtcag 
gatggggtgc ggttgcacag gtacgctcca 
acattcctgg tcgggctcaa tcaatacctg 
ccggacgtag cagtgctcac ttccatgctc 
gctaagcgta ggctggccag gggatctccc 
ctgtctgcgc cttccttgaa ggcaacatgc 
ctcatcgagg ccaacctcct gtggcggcag 
tcagaaaata aggtagtaat tttggactct 
agggaagtat ccgttccggc ggagatcctg 
cccatatggg cacgcccgga ttacaaccct 
tacgtccctc cagtggtaca cgggtgrtcca 
cctccacgga ggaagaggac ggttgtcctg 
gagctcgcca caaagacctt cggcagctcc 
acggcctctc ctgaccagcc ctccgacgac 
tcctccatgc ccccccttga gggggagccg 
tctaccgtaa gcgaggaggc tagtgaggac 
acaggcgccc tgatcacgcc atgcgctgcg 
agcaactctt tgctccgtca ccacaacttg 
ctgcggcaga agaaggtcac ctttgacaga 
gtgctcaagg agatgaaggc gaaggcgtcc 
gaagcctgta agctgacgcc cccacattcg 
gacgtccgga acctatccag caaggccgtt 
ctggaagaca ctgagacacc aattgacacc 
gtccaaccag agaagggggg ccgcaagcca 
gttcgtgtgt gcgagaaaat ggccctttac 
atgggctctt catacggatt ccaatactct 
gcctggaaag cgaagaaatg ccctatgggc 
acggtcactg agaatgacat ccgtgttgag 
cccgaagcca gacaggccat aaggtcgctc 
actaattcta aagggcagaa ctgcggctat 



tccaagaaga aatgtgatga gctcgccgcg 3600 
gcatattacc ggggccttga tgtatccgtc 3660 
gcaacggacg ctctaatgac gggctttacc 3720 
acatgtgtca cccagacagt cgacttcagc 3780 
accgtgccac aagacgcggt gtcacgctcg 3840 
atgggcattt acaggtttgt gactccagga 3900 
gttctgtgcg agtgctatga cgcgggctgt 3960 
tcagttaggt tgcgggctta cctaaacaca 4020 
gagttctggg agagcgtctt tacaggcctc 4080 
actaagcagg caggagacaa cttcccctac 4140 
agggctcagg ctccacctcc atcgtgggac 4200 
cctacgctgc acgggccaac gcccctgctg 4260 
actaccacac accccataac caaatacatc 4320 
gtcacgagca cctgggtgct ggtaggcgga 4380 
acaacaggca gcgtggtcat tgtgggcagg 4440 
cccgacaggg aagtccttta ccgggagttc 4500 
ccttacatcg aacagggaat gcagctcgcc 4560 
ctgcaaacag ccaccaagca agcggaggct 4620 
accctcgaag ccttctgggc gaagcatatg 4680 
gcaggcttgt ccactctgcc tggcaacccc 4740 
tct at caeca gcccgctcac cacccaacat 4800 
gtggccgccc aacttgctcc tcccagcgct 4 860 
ggagcggctg ttggcagcat aggccttggg 4920 
ggagcagggg tggcaggege gctcgtggcc 4980 
accgaggacc tggttaacct actccctgct 5040 
gtcgtgtgcg cagegatact gcgtcggcac 5100 
atgaacegge tgatagcgtt cgcttcgcgg 5160 
ectgagageg acgctgcagc acgtgtcact 5220 
ctgetgaaga ggctt caeca gtggatcaac 5280 
tggctaagag atgtttggga ttggatatgc 5340 
cagtccaagc tcctgccgcg attgeeggga 5400 
aagggagtct ggeggggega eggcatcatg 54 60 
aceggacatg tgaaaaaegg ttccatgagg 5520 
tggcatggaa cattccccat taacgegtae 5580 
ccaaattatt etagggeget gtggcgggtg 5640 
gtgggggatt tccactacgt gaegggcatg 5700 
gttccggccc ccgaattctt cacagaagtg 5760 
gcgtgcaaac ccctcctacg ggaggaggtc 5820 
gttgggtcac agctcccatg cgagcccgaa 5880 
accgacccct cccacattac ggcggagacg 5940 
ccctccttgg ccagctcatc agetagecag 6000 
actacccgtc atgactcccc ggaegctgae 6060 
gagatgggcg ggaacatcac ccgcgtggag 6120 
ttcgagccgc tecaagegga ggaggatgag 6180 
eggaggtcca ggaaattccc tegagegatg 6240 
ccactgttag agtectggaa ggacccggac 6300 
ttgccgcctg ccaaggcccc tccgatacca 6360 
tcagaatcta ccgtgtcttc tgccttggcg 6420 
gaategtegg ccgtcgacag cggcacggca 6480 
ggegacgegg gatccgacgt tgagtegtae 6540 
ggggatcccg atetcagega egggtcttgg 6600 
gtegtctget gctcgatgtc ctacacatgg 6660 
gaggaaacca agctgcccat caatgeactg 6720 
gtctatgeta caacatctcg cagcgcaagc 6780 
ctgcaggtcc tggacgacca ctaccgggac 6840 
acagttaagg ctaaacttct atccgtggag 6900 
gecagatcta aatttggcta tggggcaaag 6960 
aaccacatcc gctccgtgtg gaaggacttg 7020 
accatcatgg caaaaaatga ggttttctgc 7080 
gctcgcctta tcgtattccc agatttgggg 7140 
gatgtggtct ccaccctccc teaggcegtg 7200 
cctggacagc gggtcgagtt cctggtgaat 7260 
ttcgcatatg acacccgctg ttttgactca 7320 
gagtcaatct accaatgttg tgacttggcc 7380 
acagagegge tttacategg gggccccctg 74 40 
cgccggtgcc gegegagegg tgtactgacg 7500 
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accagctgcg gtaataccct cacatgttac ttgaaggccg 
aagctccagg actgcacgat gctcgtatgc ggagacgacc 
gcggggaccc aagaggacga ggcgagccta cgggccttca 
tctgcccccc ctggggaccc gcccaaacca gaatacgact 
tcctccaatg tgtcagtcgc gcacgatgca tctggcaaaa 
gaccccacca ccccccttgc gcgggctgcg tgggagacag 
tcctggctag gcaacatcat catgtatgcg cccaccttgt 
actcatttct tctccatcct tctagctcag gaacaacttg 
atctacgggg cctgttactc cattgagcca ct'tgacctac 
catggcctta gcgcattttc actccatagt tactctccag 
tcatgcctca ggaaacttgg ggtaccgccc ttgcgagtct 
gtccgcgcta ggctactgtc ccaggggggg agggctgcca 
aactgggcag taaggaccaa gctcaaactc actccaatcc 
ttatccagct ggttcgttgc tggttacagc gggggagaca 
gcccgacccc gctggttcat gtggtgccta ctcctacttt 
ctactcccca accgatgaac ggggagctaa acactccagg 
tttccctttt tttttttctt tttttttttt tttttttttt 
tttttcctct ttttttcctt ttctttcctt tggtggctcc 
tagctgtgaa aggtccgtga gccgcttgac tgcagagagt 
agatcaagt 



ctgcggcctg tcgagctgcg 7560 
ttgtcgttat ctgtgaaagc 7620 
cggaggctat gactagatac 7680 
tggagttgat aacatcatgc 7740 
gggtgtacta tctcacccgt 7800 
ctagacacac tccagtcaat 7860 
gggcaaggat gatcctgatg 7920 
aaaaagccct agattgtcag 7980 
ctcagatcat tcaacgactc 8040 
gtgagatcaa tagggtggct 8100 
ggagacatcg ggccagaagt 8160 
cttgtggcaa gtacctcttc 8220 
cggctgcgtc ccagttggat 8280 
tatatcacag cctgtctcgt 8340 
ctgtaggggt aggcatctat 8400 
ccaataggcc atcctgtttt 8460 
tttttttttt ttctcctttt 8520 
atcttagccc tagtcacggc 8580 
gctgatactg gcctctctgc 8640 

8649 
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<210> 6 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
<400> 6 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagegtet agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagageca tagtggtctg eggaaceggt gagtacaccg gaattgccag 180 
gaegaceggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 24 0 
gcgagactgc tagecgagta gtgttgggtc gegaaaggee ttgtggtact gectgatagg 300 
gtgettgega gtgccccggg aggtctegta gaeegtgeae catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
aegcaggtte tccggccgct tgggtggaga ggctattegg ctatgactgg gcacaacaga 480 
caateggctg ctctgatgcc gccgtgttcc ggctgtcagc geaggggege ccggttcttt 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgea ggacgaggca gegeggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagegg 660 
gaagggactg getgetattg ggcgaagtgc eggggcagga tctcctgtea tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgcaatgCg geggctgeat aegcttgate 780 
cggctacctg cccattcgac caccaagcga aacategcat egagegagea cgtactcgga 840 
tggaagcegg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggegegea tgcccgacgg cgaggatctc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct accegtgata 1080 
ttgetgaaga gettggegge gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gecttcttga cgagttcttc tgagtttaaa 1200 
cagaccacaa cggtttccct etagegggat caattccgcc cctctccctc ccccccccct 1260 
aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccaccatat tgccgtcttt tggcaatgtg agggecegga aacctggccc tgtcttcttg 1380 
acgagcattc ctaggggtct ttcccctctc gecaaaggaa tgeaaggtet gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caaegtctgt agcgaccctt 1500 
tgeaggcage ggaacccccc acctggcgac aggtgectet gcggccaaaa gccacgtgta 1560 
taagatacac ctgeaaagge ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc etcaagegta ttcaacaagg ggctgaagga tgcccagaag 1680 
gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgetttae atgtgtttag 1740 
tcgaggttaa aaaaegtcta ggccccccga accaegggga cgtggttttc ctttgaaaaa 1800 
cacgataata ccatggcgec tattaeggee tactcccaac agacgegagg cctacttgge 1860 
tgeatcatea ctagcctcac aggcegggae aggaaccagg tcgaggggga ggtccaagtg 1920 
gtctccaccg caacacaatc tttcctggcg acctgcgtca atggcgtgtg ttggactgtc 1980 
tatcatggtg ccggctcaaa gacccttgcc ggeccaaagg gcccaatcac ccaaatgtac 2040 
accaatgtgg accaggacct cgtcggctgg caagcgcccc ccggggcgcg ttccttgaca 2100 
ccatgcacct gcggcagctc ggacctttac ttggtcacga ggcatgeega tgtcattccg 2160 
gtgcgccggc ggggcgacag cagggggagc ctactctccc ccaggcccgt ctcctacttg 2220 
aagggctctt cgggcggtcc actgctctgc ccctcggggc atgctgtggg catctttegg 2280 
gctgccgtgt gcacccgagg ggttgcgaag gcggtggact ttgtacccgt cgagtctatg 2340 
gaaaccacta tgcggtcccc ggtcttcacg gaeaactegt cccctccggc cgtaccgcag 2400 
acattccagg tggcccatct acacgcccct actggtagcg gcaagagcac taaggtgccg 2460 
getgegtatg cagcccaagg gtataaggtg cttgtcctga acccgtccgt cgccgccacc 2520 
ctaggtttcg gggegtatat gtctaaggca catggtatcg accctaacat cagaaceggg 2580 
gtagggacca tcaccacggg tgcccccatc acgtactcca cctatggcaa gtttcttgee 2640 
gacggtggtt gctctggggg cgcctatgac atcataatat gtgatgagtg ccactcaact 2700 
gactcgacca ctatcctggg catcggcaca gtcctggacc aageggagae ggctggagcg 2760 
cgactcgtcg tgctcgccac cgctacgcct cegggategg tcaccgtgcc acatccaaac 2820 
atcgaggagg tggctctgtc cagcactgga gaaatcccct tttatggcaa agccatcccc 2880 
atcgcgacca tcaagggggg gaggcacctc attttctgec. attecaagaa gaaatgtgat 2940 
gagctcgccg cgaagctatc cggcctcgga etcaatgetg tagcatatta ccggggcctt 3000 
gatgtatccg tcataccaac tageggagae gtcat'egteg tagcaaegga cgctctaatg 3060 
aegggcttta ccggcgattt cgactcagtg ategactgea atacatgtgt cacccagaca 3120 
gtcgacttca gcctggaccc gaccttcacc attgagacga cgaccgtgcc acaagacgeg 3180 
gtgtcacgct cgcagcggcg aggcaggact ggtaggggca ggatgggcat ttacaggttt 3240 
gtgactccag gagaaeggee ctegggcatg ttcgattcct cggttctgtg egagtgetat 3300 
gaegeggget gtgcttggta cgagctcacg cccgccgaga cctcagttag gttgeggget 3360 
tacctaaaca caccagggct gcccgtctgc caggaccatc tggagttctg ggagagcgtc 3420 
tttacaggee tcacccacat agacgcccat ttcttgtccc agactaggca ggcaggagac 3480 
aacttcccct acctggtagc ataccaggct acggtgtgcg ccagggctca ggctccacct 354 0 
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ccatcgtggg accaaatgtg ggagtgtctc 
acgcccctgc tgtataggct gggagccgtt 
accaaataca tcatggcatg catgtcggct 
ctggtaggcg gagtcctagc agctctggcc 
attgtgggca ggatcatctt gtccggaaag 
taccgggagt tcgatgagat ggaagagtgc 
atgcagctcg ccgaacaatt caaacagaag 
caagcggagg ctgctgctcc cgtggtggaa 
gcgaagcata tgtggaattt catcagcggg 
cctggcaacc ccgcgatagc atcactgatg 
accacccaac ataccctcct gtttaacatc 
cctcccagcg ctgcttctgc tttcgtaggc 
ataggccttg ggaaggtgct tgtggatatt 
gcgctcgtgg cctttaaggt catgagcggc 
ctactccctg ctatcctctc ccctggcgcc 
ctgcgtcggc acgtgggccc aggggagggg 
ttcgcttcgc ggggtaacca cgtctccccc 
gcacgtgtca ctcagatcct ctctagtctt 
cagtggatca acgaggactg ctccacgcca 
gattggatat gcacggtgtt gactgatttc 
cgattgccgg gagtcccctt cttctcatgt 
gacggcatca tgcaaaccac ctgcccatgt 
ggttccatga ggatcgtggg gcctaggacc 
attaacgcgt acaccacggg cccctgcacg 
ctgtggcggg tggctgctga ggagtacgtg 
gtgacgggca tgaccactga caacgtaaag 
ttcacagaag tggatggggt gcggttgcac 
cgggaggagg tcacattcct ggtcgggctc 
tgcgggcccg aaccggacgt agcagtgctc 
acggcggaga cggctaagcg taggctggcc 
tcagctagcc agctgtctgc gccttccttg 
ccggacgctg acctcatcga ggccaacctc 
acccgcgtgg agtcagaaaa taaggtagta 
gaggaggatg agagggaagt atccgttccg 
cctcgagcga tgcccatatg ggcacgcccg 
aaggacccgg actacgtccc tccagtggta 
cctccgatac cacctccacg gagggagagg 
tctgccttgg cggagctcgc cacaaagacc 
agcggcacgg caacggcctc tcctgaccag 
gttgagtcgt actcctccat gccccccctt 
gacgggtctt ggtctaccgt aagcgaggag 
tcctacacat ggacaggcgc cctgatcacg 
gtcaatgcac tgagcaactc tttgctccgt 
cgcagcgcaa gcctgcggca gaagaaggtc 
cactaccggg acgtgctcaa ggagatgaag 
ctatccgtgg aggaagcctg taagctgacg 
tatggggcaa aggacgtccg gaacctatcc 
tggaaggact tgctggaaga cactgagaca 
gaggttttct gcgtccaacc agagaagggg 
ccagatttgg gggttcgtgt gtgcgagaaa 
cctcaggccg tgatgggctc ttcatacgga 
ttcctggtga atgcctggaa agcgaagaaa 
tgttttgact caacggtcac tgagaatgac 
tgtgacttgg cccccgaagc cagacaggcc 
gggggccccc tgactaattc taaagggcag 
ggtgtactga cgaccagctg cggtaatacc 
tgtcgagctg cgaagctcca ggactgcacg 
atctgtgaaa gcgcggggac ccaagaggac 
atgactagat actctgcccc ccctggggac 
ataacatcat gctcctccaa tgtgtcagtc 
tatctcaccc gtgaccccac cacccccctt 
actccagtca attcctggct aggcaacatc 
atgatcctga tgactcattt cttctccatc 
ctagattgtc agatctacgg ggcctgttac 
attcaacgac tccatggcct tagcgcattt 
aatagggtgg cttcatgcct caggaaactt 



atacggctaa agcctacgct gcacgggcca 3600 
caaaacgagg ttactaccac acaccccata 3660 
gacctggagg. tcgtcacgag cacctgggtg 3720 
gcgtattgcc tgacaacagg cagcgtggtc 3780 
ccggccatca ttcccgacag ggaagtcctt 3840 
gcctcacacc tcccttacat cgaacaggga 3900 
gcaatcgggt tgctgcaaac agccaccaag 3960 
tccaagtggc ggaccctcga agccttctgg 4020 
atacaatatt tagcaggctt gtccactctg 4080 
gcattcacag cctctatcac cagcccgctc 414 0 
ctggggggat gggtggccgc ccaacttgct 4200 
gccggcatcg ctggagcggc tgttggcagc 4260 
ttggcaggtt atggagcagg ggtggcaggc 4 320 
gagatgccct ccaccgagga cctggttaac 4 380 
ctagtcgtcg gggtcgtgtg cgcagcgata 4440 
gctgtgcagt ggatgaaccg gctgatagcg 4500 
acgcactatg tgtctgagag cgacgctgca 4560 
accatcactc agctgctgaa gaggcttcac 4620 
tgctccggct cgtggctaag agatgtttgg 4680 
aagacctggc tccagtccaa gctcctgccg 4740 
caacgrtgggt acaagggagt ctggcggggc 4800 
ggagcacaga tcaccggaca tgtgaaaaac 4860 
tgtagtaaca cgtggcatgg aacattcccc 4920 
ccctccccgg cgccaaatta ttctagggcg 4980 
gaggttacgc gggtggggga tttccactac 5040 
tgcccgtgtc aggttccggc ccccgaattc 5100 
aggtacgctc cagcgtgcaa acccctccta 5160 
aatcaatacc tggttgggtc acagctccca 5220 
acttccatgc tcaccgaccc ctcccacatt 5280 
aggggatctc ccccctcctt ggccagctca 5340 
aaggcaacat gcactacccg tcatgactcc 5400 
ctgtggcggc aggagatggg cgggaacatc 5460 
attttggact ctttcgagcc gctccaagcg 5520 
gcggagatcc tgcggaggtc caggaaattc 5580 
gattacaacc ctccactgtt agagtcctgg 5640 
cacgggtgtc cattgccgcc tgccaaggcc 5700 
acggttgtcc tgtcagaatc taccgtgtct 5760 
ttcggcagct ccgaatcgtc ggccgtcgac 5820 
ccctccgacg acggcgacgc gggatccgac 5680 
gagggggagc cgggggatcc cgatctcagc 5940 
gctagtgagg acgtcgtctg ctgctcgatg 6000 
ccatgcgctg cggaggaaac caagctgccc 6060 
caeca caact tggtctatgc tacaacatct 6120 
acctttgaca gaetgeaggt cctggacgac 6180 
gcgaaggcgt ccacagttaa ggctaaactt 624 0 
cccccacatt cggccagatc taaatttggc 6300 
ageaaggecg ttaaccacat ccgctccgtg 6360 
ccaattgaca ccaccatcat ggcaaaaaat 6420 
ggccgcaagc cagctcgcct tategtatte 6480 
atggcccttt acgatgtggt ctccaccctc 6540 
ttccaatact ctcctggaca gegggtcgag 6600 
tgccctatgg gettegcata tgacacccgc 6660 
atccgtgttg aggagtcaat ctaccaatgt 6720 
ataaggtege teacagageg gctttacatc 6780 
aactgegget ategceggtg ccgcgcgagc 6840 
ctcacatgtt atttgaaggc cgctgcggcc 6900 
atgetegtat geggagaega ccttgtcgtt 6960 
gaggegagee taegggcett caeggagget 7020 
ccgcccaaac cagaatacga cttggagttg 7080 
gcgcacgatg catctggcaa aagggtgtac 7140 
gcgcgggctg cgtgggagac agctagacac 7200 
atcatgtatg cgcccacctt gtgggcaagg 7260 
cttctagctc aggaacaact tgaaaaagee 7320 
tccattgagc cacttgacct acctcagatc 7380 
tcactccata gttactctcc aggtgagatc 7440 
ggggtacege ecttgegagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg tcccaggggg ggagggctgc cacttgtggc 7560 

aagtacctct tcaactgggc agtaaggacc aagctcaaac tcactccaat cccggctgcg 7620 

tcccagttgg atttatccag ctggttcgtt gctggttaca gcgggggaga catatatcac 7680 

agcctgtctc gtgcccgacc ccgctggttc atgtggtgcc tactcctact ttctgtaggg 7740 

gtaggcatct atctactccc caaccgatga acggggagct aaacactcca ggccaatagg 7800 

ccatcctgtt tttttccctt tttttttttc tttttttttt tttttttttt tttttttttt 7860 

ttttctcctt tttttttcct ctttttttcc ttttctttcc tttggtggct ccatcttagc 7920 

cctagtcacg gctagctgtg aaaggtccgt gagccgcttg actgcagaga gtgctgatac 7980 

tggcctctct gcagatcaag t 8001 
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<210> 7 
<211> 11076 
<212> DNA 

<213> Hepatitis C virus 
<400> 7 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc -ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ecatgggcac gaatcctaaa 
cgccgcccac aggacgtcaa gttcccgggc 
ttgccgcgca ggggccccag gttgggtgtg 
caacctcgtg gaaggcgaca acctatcccc 
gctcagcccg ggtacccctg gcccctctat 
ctcctgtcac cccgtggctc tcggcctagt 
cgcaatttgg gtaaggtcat cgataccctc 
attccgctcg tcggcgcccc cctagggggc 
gttctggagg acggcgtgaa ctatgcaaca 
ttccttttgg ctttgctgtc ctgtttgacc 
gtatccggag tgtaccatgt cacgaacgac 
gcggacatga tcatgcatac ccccgggtgc 
cgctgctggg tagcgctcac tcccacgctc 
acgatacgac gccatgtcga tttgctcgtt 
gtgggagatc tctgcggatc tgttttcctc 
cggcacgaga cagtacagga ctgcaattgc 
cgtatggctt gggatatgat gatgaactgg 
ttactccgga tcccacaagc tgtcgtggat 
gcgggccttg cctactattc catggtgggg 
ctctttgccg gcgttgacgg gggaacctat 
ctcgggatta cgtccctctt ttcacccggg 
aacggcagct ggcacatcaa caggactgcc 
ttccttgctg cgctgttcta cgtgcacaag 
gccagctgca gccccatcga cgcgttcgct 
tcacacagct cggaccagag gccttattgt 
gtacccgcgg cgcaggtgtg tggtccagtg 
gggacgaccg accggttcgg cgtccctacg 
ctgcttctta acaacacgcg gccgccgcaa 
agcactgggt tcaccaagac gtgcgggggc 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 480 
ggctgtcagc gcaggggcgc ccggtfccttfc 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgcg gcggctgcat acgcttgatc 780 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 174 0 
accacgggga cgtggttttc ctttgaaaaa 1800 
cctcaaagaa aaaccaaacg taacaccaac 1860 
ggtggtcaga tcgtcggtgg agtttacctg 1920 
cgcgcgacta ggaagacttc cgagcggtcg 1980 
aaggctcgcc agcccgaggg tagggcctgg 2040 
ggcaatgagg gcttggggtg ggcaggatgg 2100 
tggggcccca cggacccccg gcgtaggtcg 2160 
acgtgcggct tcgccgatct catggggtac 2220 
gctgccaggg ccctggcgca tggcgtccgg 2280 
gggaatctgc ccggttgctc cttttctatc .2340 
atcccagctt ccgcttatga agtgcgcaac 2400 
tgctccaacg caagcattgt gtatgaggca 2460 
gtgccctgcg ttcgggagaa caactcctcc 2520 
gcggccagga acgctagcgt ccccactacg 2580 
ggggcggctg ctctctgctc cgctatgtac 2640 
gtcgcccagc tgttcacctt ctcgcctcgc 2700 
tcaatatatc ccggccacgt gacaggtcac 2760 
tcacctacag cagccctagt ggtatcgcag 2820 
atggtggcgg gggcccattg gggagtccta 2880 
aactgggcta aggttctgat tgtgatgcta 2940 
gtgacagggg ggacgatggc caaaaacacc 3000 
tcatcccaga aaatccagct tgtaaacacc 3060 
ctgaactgca atgactccct caacactggg 3120 
ttcaactcat ctggatgccc agagcgcatg 3180 
caggggtggg ggcccatcac ttacaatgag 324 0 
tggcactacg caccccggcc gtgcggtatc 3300 
tactgcttca ccccaagccc tgtcgtggtg 3360 
tacagttggg gggagaatga gacggacgtg 3420 
ggcaactggt ttggctgtac atggatgaat 3480 
cccccgtgta acatcggggg gatcggcaat 3540 
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aaaaccttga cctgccccac ggactgcttc 
tgtggttcgg ggccttggtt gacacccaga 
cactacccct gcactgtcaa ctttaccatc 
gagcacaggc tcgaagccgc atgcaattgg 
agggacagat cagagcttag cccgctgctg 
tgttccttca ccaccctacc ggctctgtcc 
gtggacgtac aatacctgta cggtataggg 
gagtatgtcc tgttgctctt ccttcttctg 
atgatgctgc tgatagctca agctgaggcc 
gcatccgtgg ccggggcgca tggcattctc 
tacatcaagg gcaggctggt ccctggggcg 
ctcctgctcc tgctggcgtt accaccacga 
tcgtgcggag gcgcggtttt cgtaggtctg 
ctgttcctcg ctaggctcat atggtggtta 
ttgcaagtgt ggatcccccc cctcaacgtt 
acgtgcgcga tccacccaga gctaatcttt 
ggtccactca tggtgctcca ggctggtata 
gggctcattc gtgcatgcat gctggtgcgg 
gctctcatga agttggccgc actgacaggt 
cgggactggg cccacgcggg cctacgagac 
tctgatatgg agaccaaggt tatcacctgg 
atcttgggcc tgcccgtctc cgcccgcagg 
agccttgaag ggcaggggtg gcgactcctc 
cgaggcctac ttggctgcat catcactagc 
ggggaggtcc aagtggtctc caccgcaaca 
gtgtgttgga ctgtctatca tggtgccggc 
atcacccaaa tgtacaccaa tgtggaccag 
gcgcgttcct tgacaccatg cacctgcggc 
gccgatgtca ttccggtgcg ccggcggggc 
cccgtctcct acttgaaggg ctcttegggc 
gtgggcatct ttegggctge cgtgtgcacc 
cccgtcgagt ctatggaaac cactatgcgg 
ccggccgtac cgcagacatt ccaggtggcc 
agcactaagg tgccggctgc gtatgcagcc 
tccgtcgccg ccaccctagg tttcggggcg 
aacatcagaa ccggggtagg gaccatcacc 
ggcaagtttc ttgccgacgg tggttgctct 
gagtgccact caactgactc gaccactatc 
gagacggctg gagcgcgact cgtcgtgctc 
gtgccacatc caaacatcga ggaggtggct 
ggcaaagcca tccccatcgc gaccatcaag 
aagaagaaat gtgatgagct cgccgcgaag 
tattaccggg gccttgatgt atccgtcata 
acggacgctc taatgacggg ctttaccggc 
tgtgtcaccc agacagtcga cttcagcctg 
gtgccacaag acgcggtgtc acgctcgcag 
ggcatttaca ggtttgtgac tccaggagaa 
ctgtgcgagt gctatgacgc gggctgtgct 
gttaggttgc gggcttacct aaacacacca 
ttctgggaga gcgtctttac aggcctcacc 
aggcaggcag gagacaactt cccctacctg 
gctcaggctc cacctccatc gtgggaccaa 
acgctgcacg ggccaacgcc cctgctgtat 
accacacacc ccataaccaa atacatcatg 
acgagcacct gggtgctggt aggcggagtc 
acaggcagcg tggtcattgt gggcaggatc 
gacagggaag tcctttaccg ggagttcgat 
tacatcgaac agggaatgca gctcgccgaw 
caaacagcca ccaagcaagc ggaggctgct 
ctcgaagcct tctgggcgaa gcatatgtgg 
ggcttgtcca ctctgcctgg caaccccgcg 
atcaccagcc cgctcaccac ccaacatacc 
gccgcccaac ttgctcctcc cagcgctgct 
gcggctgttg gcagcatagg ccttgggaag 
gcaggggtgg caggcgcgct cgtggccttt 
gaggacctgg ttaacctact ccctgctatc 



cggaagcacc ccgaggccac ttacaccaag 3600 
tgcttggtcc actacccata caggctttgg 3660 
ttcaaggtta ggatgtacgt ggggggagtg 3720 
actcgaggag agcgttgtaa cctggaggac 3780 
ctgtctacaa cggagtggca ggtattgccc 3640 
actggtttga tccatctcca tcagaacgtc 3900 
tcggcggttg tctcctttgc aatcaaatgg 3960 
gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
gccctagaga acctggtggt cctcaacgcg 4080 
tccttcctcg tgttcttctg tgctgcctgg 4140 
gcatatgccc tctacggcgt atggccgcta 4200 
gcatacgcca tggaceggga gatggcagea 4260 
atactcttga ccttgtcacc gcactataag 4320 
caatatttta tcaccagggc cgaggcacac 4380 
cgggggggcc gcgatgccgt catcctcctc 4440 
accatcacca aaatcttgct cgccatactc 4500 
accaaagtgc cgtacttcgt gcgcgcacac 4560 
aaggttgctg ggggtcatta tgtccaaatg 4620 
acgtacgttt atgaccatct caccccactg 4680 
cttgcggtgg cagttgagcc cgtcgtcttc 4740 
ggggcagaca ccgcggcgtg tggggacatc 4 600 
gggagggaga tacatctggg accggcagac 4 660 
gcgcctatta cggcctactc ccaacagacg 4920 
ctcacaggcc gggacaggaa ccaggtcgag 4980 
eaatctttcc tggcgacctg cgtcaatggc 5040 
tcaaagaccc ttgccggccc aaagggccca 5100 
gaccrtcgtcg gctggcaagc gccccccggg 5160 
agctcggacc tttacttggt cacgaggcat 5220 
gacagcaggg ggagcctact ctcccccagg 5280 
ggtccactgc tctgcccctc ggggcatgcrt 5340 
cgaggggttg cgaaggcggt ggactttgta 5400 
tccccggtct tcacggacaa ctcgtcccct 5460 
catctacacg cccctactgg tagcggcaag 5520 
caagggtata aggtgcttgt cctgaacccg 5580 
tatatgtcta aggcacatgg tatcgaccct 5640 
acgggtgccc ccatcacgta ctccacctat 5700 
gggggcgcct atgacatcat aatatgtgat 5760 
ctgggcatcg gcacagtcct ggaccaagcg 5820 
gccaccgcta cgcctccggg atcggtcacc 5880 
ctgtccagca ctggagaaat ccccttttat 5940 
ggggggaggc acctcatttt ctgccattcc 6000 
ctatccggcc tcggactcaa tgctgtagca 6060 
ccaactagcg gagacgtcat tgtcgtagca 6120 
gatttcgact. cagtgatcga ctgcaataca 6160 
gacccgacct tcaccattga gacgacgacc 6240 
cggcgaggca ggactggtag gggcaggatg 6300 
cggccctcgg gcatgttcga ttcctcggtt 6360 
tggtacgagc tcacgcccgc cgagacctca 6420 
gggctgcccg tctgccagga ccatctggag 6480 
cacatagacg cccatttctt gtcccagact 6540 
gtagcatacc aggctacggt gtgcgccagg 6600 
atgtgggagt gtctcatacg gctaaagcct 6660 
aggctgggag ccgttcaaaa cgaggttact 6720 
gcatgcatgt cggctgacct ggaggtcgtc 6780 
ctagcagctc tggccgcgta ttgcctgaca 6840 
atcttgtccg gaaagccggc catcattccc 6900 
gagatggaag agtgcgcctc acacctccct 6960 
caattcaaac agaaggcaat cgggttgctg 7020 
gctcccgtgg tggaatccaa gtggcggacc 7080 
aatttcatca gcgggataca atatttagca 7140 
atagcatcac tgatggcatt cacagcctct 7200 
ctcctgttta acatcctggg gggatgggtg 7260 
tctgctttcg taggcgccgg catcgctgga 7320 
gtgcttgtgg atattttggc aggttatgga 7380 
aaggtcatga gcggcgagat gccctccacc 7440 
ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag 
aaccggctga 
gagagcgacg 
ctgaagaggc 
ctaagagatg 
tccaagctcc 
ggagtctggc 
ggacatgtga 
catggaacat 
aattattcta 
ggggatttcc 
ccggcccccg 
tgcaaacccc 
gggtcacagc 
gacccctccc 
tccttggcca 
acccgtcatg 
atgggcggga 
gagccgctcc 
aggtccagga 
ctgttagagt 
ccgcctgcca 
gaatctaccg 
tcgtcggccg 
gacgcgggat 
gatcccgatc 
gtctgctgct 
gaaaccaagc 
tatgctacaa 
caggtcctgg 
gttaaggcta 
agatctaaat 
cacatccgct 
atcatggcaa 
cgccttatcg 
gtggtctcca 
ggacagcggg 
gcatatgaca 
tcaatctacc 
gagcggcttt 
cggtgccgcg 
aaggccgctg 
gacgaccttg 
gccttcacgg 
tacgacttgg 
ggcaaaaggg 
gagacagcta 
accttgtggg 
caacttgaaa 
gacctacctc 
tctccaggtg 
cgagtctgga 
gctgccactt 
ccaatcccgg 
ggagacatat 
ctactttctg 
ctccaggcca 
tttttttttt 
tggctccatc 
agagagtgct 



cgatactgcg 
tagcgttcgc 
ctgcagcacg 
ttcaccagtg 
tttgggattg 
tgccgcgatt 
ggggcgacgg 
aaaacggttc 
tccccattaa 
gggcgctgtg 
actacgtgac 
aattcttcac 
tcctacggga 
tcccatgcgg 
acattacggc 
gctcatcagc 
actccccgga 
acatcacccg 
aagcggagga 
aattccctcg 
cctggaagga 
aggcccctcc 
tgtcttctgc 
tcgacagcgg 
ccgacgttga 
tcagcgacgg 
cgatgtccta 
tgcccgtcaa 
catctcgcag 
acgaccacta 
aacttctatc 
ttggctatgg 
ccgtgtggaa 
aaaatgaggt 
tattcccaga 
ccctccctca 
tcgagttcct 
cccgctgttt 
aatgttgtga 
acatcggggg 
cgagcggtgt 
cggcctgtcg 
tcgttatctg 
aggctatgac 
agttgataac 
tgtactatct 
gacacactcc 
caaggatgat 
aagccctaga 
agatcattca 
agatcaatag 
gacatcgggc 
gtggcaagta 
ctgcgtccca 
atcacagcct 
taggggtagg 
ataggccatc 
tttttttttc 
ttagccctag 
gatactggcc 



tcggcacgtg 
ttcgcggggt 
tgtcactcag 
gatcaacgag 
gatatgcacg 
gccgggagtc 
catcatgcaa 
catgaggatc 
cgcgtacacc 
gcgggtggct 
gggcatga cc 
agaagtggat 
ggaggtcaca 
gcccgaaccg 
ggagacggct 
tagccagctg 
cgctgacctc 
cgtggagtca 
ggatgagagg 
agcgatgccc 
cccggactac 
gataccacct 
cttggcggag 
cacggcaacg 
gtcgtactcc 
gtcttggtct 
cacatggaca 
tgcactgagc 
cgcaagcctg 
ccgggacgtg 
cgtggaggaa 
ggcaaaggac 
ggacttgctg 
tttctgcgtc 
tttgggggtt 
ggccgtgatg 
ggtgaatgcc 
tgactcaacg 
cttggccccc 
ccccctgact 
actgacgacc 
agctgcgaag 
tgaaagcgcg 
tagatactct 
atcatgctcc 
cacccgtgac 
agtcaattcc 
cctgatgact 
ttgtcagatc 
acgactccat 
ggtggcttca 
cagaagtgtc 
cctcttcaac 
gttggattta 
gtctcgtgcc 
catctatcta 
ctgttttttt 
tccttttttt 
tcacggctag 
tctctgcaga 



ggcccagggg 
aaccacgtct 
atcctctcta 
gactgctcca 
gtgttgactg 
cccttcttct 
accacctgcc 
gtggggccta 
acgggcccct 
gctgaggagt 
actgacaacg 
ggggtgcggt 
ttcctggtcg 
gacgtagcag 
aagcgtaggc 
tctgcgcctt 
atcgaggcca 
gaaaataagg 
gaagtatccg 
atatgggcac 
gtccctccag 
ccacggaggg 
ctcgccacaa 
gcctctcctg 
tccatgcccc 
accgtaagcg 
ggcgccctga 
aactctttgc 
cggcagaaga 
ctcaaggaga 
gcctgtaagc 
gtccggaacc 
gaagacactg 
caaccagaga 
cgtgtgtgcg 
ggctcttcat 
tggaaagcga 
gtcactgaga 
gaagccagac 
aattctaaag 
agctgcggta 
ctccaggact 
gggacccaag 
gccccccctg 
tccaatgtgt 
cccaccaccc 
tggctaggca 
catttcttct 
tacggggcct 
ggccttagcg 
tgcctcagga 
cgcgctaggc 
tgggcagtaa 
tccagctggt 
cgaccccgct 
ctccccaacc 
cccttttttt 
ttcctctttt 
ctgtgaaagg 
tcaagt 



agggggctgt 
cccccacgca 
gtcttaccat 
cgccatgctc 
atttcaagac 
catgtcaacg 
catgtggagc 
ggacctgtag 
gcacgccctc 
acgtggaggt 
taaagtgccc 
tgcacaggta 
ggctcaatca 
tgctcacttc 
tggccagggg 
ccttgaaggc 
acctcctgtg 
tagtaatttt 
ttccggcgga 
gcccggatta 
tggtacacgg 
agaggacggt 
agaccttcgg 
accagccctc 
cccttgaggg 
aggaggctag 
tcacgccatg 
tccgtcacca 
aggtcacctt 
tgaaggcgaa 
tgacgccccc 
tatccagcaa 
agacaccaat 
aggggggccg 
agaaaatggc 
acggattcca 
agaaatgccc 
atgacatccg 
aggccataag 
ggcagaactg 
ataccctcac 
gcacgatgct 
aggacgaggc 
gggacccgcc 
cagtcgcgca 
cccttgcgcg 
acatcatcat 
ccatccttct 
gttactccat 
cattttcact 
aacttggggt 
tactgtccca 
ggaccaagct 
tcgttgctgg 
ggttcatgtg 
gatgaacggg 
ttttcttttt 
tttccttttc 
tccgtgagcc 



gcagtggatg 
ctatgtgtct 
cactcagctg 
cggctcgtgg 
ctggctccag 
tgggtacaag 
acagatcacc 
taacacgtgg 
cccggcgcca 
tacgcgggtg 
gtgtcaggtt 
cgctccagcg 
atacctggtt 
catgctcacc 
atctcccccc 
aacatgcact 
gcggcaggag 
ggactctttc 
gatcctgcgg 
caaccctcca 
gtgtccattg 
tgtcctgtca 
cagctccgaa 
cgacgacggc 
ggagccgggg 
tgaggacgtc 
cgctgcggag 
caacttggtc 
tgacagactg 
ggcgtccaca 
acattcggcc 
ggccgttaac 
tgacaccacc 
caagccagct 
cctttacgat 
atactctcct 
tatgggcttc 
tgttgaggag 
gtcgctcaca 
cggctatcgc 
atgttatttg 
cgtatgcgga 
gagcctacgg 
caaaccagaa 
cgatgcatct 
ggctgcgtgg 
gtatgcgccc 
agctcaggaa 
tgagccactt 
ccatagttac 
accgcccttg 
gggggggagg 
caaactcact 
ttacagcggg 
gtgcctactc 
gagctaaaca 
tttttttttt 
tttcctttgg 
gcttgactgc 



7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 
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8640 

8700 

8760 
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8880 
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9600 
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10260 
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10560 
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11076 
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<210> 8 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
<400> 8 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgcfcattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggegcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc etaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatggcgcc tattacggcc 
tgcatcatca ctagcctcac aggccgggac 
gtctccaccg caacacaatc tttcctggcg 
tatcatggtg ccggctcaaa gacccttgcc 
accaatgtgg accaggacct cgtcggctgg 
ccatgcacct gcggcagctc ggacctttac 
gtgcgccggc ggggcgacag cagggggagc 
aagggctctt cgggcggtcc actgctctgc 
gctgccgtgt gcacccgagg ggttgcgaag 
gaaaccacta tgcggtcccc ggtcttcacg 
acattccagg tggcccatct acacgcccct 
gctgcgtatg cagcccaagg gtataaggtg 
ctaggtttcg gggcgtatat gtctaaggca 
gtaaggacca tcaccacggg tgcccccatc 
gacggtggtt gctctggggg cgcctatgac 
gactcgacca ctatcctggg catcggcaca 
cgactcgtcg tgctcgccac cgctacgcct 
atcgaggagg tggctctgtc cagcactgga 
atcgagacca tcaagggggg gaggcacctc 
gagctcgccg cgaagctgtc cggcctcgga 
gatgtatccg tcataccaac r.agcggagac 
acgggcttta ccggtgactt cgactcagtg 
gtcgacttca gcctggaccc gaccttcacc 
gtgtcacgct cgcagcggcg aggcaggact 
gtgactccag gagaacggcc ctcgggcatg 
gacgcgggct gtgcttggta cgagctcacg 
tacctaaaca caccagggtt gcccgtctgc 
tttacaggcc tcacccacat agacgcccat 
aacttcccct acctggtagc ataccaggct 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 480 
ggctgtcagc gcaggggcgc ccggttcttt 54 0 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgcg gcggcfcgeat acgcttgatc 780 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1800 
tactcccaac agacgcgagg ectacttggc 1860 
aggaaccagg tcgaggggga ggtccaagtg 1920 
acctgcgtca atggcgtgtg ttggactgtc 1980 
ggcccaaagg gcccaatcac ccaaatgtac 2040 
caagcgcccc ccggggcgcg ttccttgaca 2100 
ttggtcacga ggcatgccga tgtcattccg 2160 
ctactctccc ccaggcccgt ctcctacttg 2220 
ccctcggggc acgctgtggg catctttcgg 2280 
gcggtggact ttgtacccgt cgagtctatg 2340 
gacaactcgt cccctccggc cgtaccgcag 2400 
actggtagcg gcaagagcac taaggtgccg 2460 
cttgtcctga acccgtccgt cgccgccacc 2520 
catggtatcg accctaacat cagaatcggg 2580 
acgtactcca cctatggcaa gtttcttgcc 2640 
atcataatat gtgatgagtg ccactcaact 2700 
gtcctggacc aagcggagac ggctggagcg 2760 
ccgggatcgg tcaccgtgcc acatccaaac 2820 
gaaatcccct tttatggcaa agccatcccc 2880 
attttctgcc attccaagaa gaaatgtgat 294 0 
ctcaatgctg tagcatatta ccggggcctt 3000 
gtcattgtcg tagcaacgga cgctctaatg 3060 
atcgactgca atacatgtgt cacccagaca 3120 
attgagacga cgaccgtgcc acaagacgcg 3180 
ggtaggggca ggatgggcat ttacaggttt 3240 
ttcgattcct cggttctgtg cgagtgctat 3300 
cccgccgaga cctcagttag gttgcgggct 3360 
caggaccatc tggagttctg ggagagcgtc 3420 
ttcttgtccc agactaagca ggcaggagac 34 80 
acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg accaaatgtg gaagtgtctc 
acgcccctgc tgtataggct gggagccgtt 
accaaataca tcatggcatg catgtcggct 
ctggtaggcg gagtcctagc agctctggcc 
attgtgggca ggatcatctt gtccggaaag 
taccgggagt tcgatgagat ggaagagtgc 
atgcagctcg ccgaacaatt caaacagaag 
caagcggagg ctgctgctcc cgtggtggaa 
gcgaagcata tgtggaattt catcagcggg 
cctggcaacc ccgcgatagc atcactgatg 
accacccaac ataccctcct gtttaacatc 
cctcccagcg ctgcttctgc tttcgtaggc 
ataggccttg ggaaggtgct tgtggatatt 
gcgctcgtgg cctttaaggt catgagcggc 
ctactccctg ctatcctctc ecctggcgcc 
ctgcgtcggc acgtgggccc aggggagggg 
ttcgcttcgc ggggtaacca cgtctccccc 
gcacgtgtca ctcagatcct ctctagtctt 
cagtggatca acgaggactg ctccacgcca 
gattggatat gcacggtgtt gactgatttc 
cgattgccgg gagtcccctt cttctcatgt 
gacggcatca tgcaaaccac ctgcccatgt 
ggttccatga ggatcgtggg gcctaggacc 
attaacgcgt acaccacggg cccctgcacg 
ctgtggcggg tggctgctga ggagtacgtg 
gtgacgggca tgaccactga cgacgtaaag 
ttcacagaag tggatggggt gcggttgcac 
cgggaggagg tcacattcct ggtcgggctc 
tgcgagcccg aaccggatgt agcagtgctc 
acggcggaga cggctaagcg taggctggcc 
tcagctagcc agctgtctgc gccttccttg 
ccggacgctg acctcatcga ggccaacctc 
acccgcgtgg agtcagaaaa taaggtagta 
gaggaggatg agagggaagt atccgtteeg 
cctcgagcga tgcccatatg ggcacgcccg 
aaggacccgg actacgtccc tccagtggta 
cctccgatac caccttcacg gaggaagagg 
tctgccttgg cggagctcgc cacagagacc 
agcggcacgg caacggcctc tcctgaccag 
gttgagtcgt actcctccat gccccccctt 
gacgggtctt ggtctaccgt aagcgaggag 
tcctacacat ggacaggcgc cctgatcacg 
atcaatgcac tgagcaactc tttgctccgt 
cgcagcgcaa gcctgcggca gaagaaggtc 
cactaccggg acgtgctcaa ggagatgaag 
ctatccgtgg aggaagcctg taagctgacg 
tatggggcaa aggacgtccg gaacctatcc 
tggaaggact tgctggaaga cactgagaca 
gaggttttct gcgtccaacc agagaagggg 
ccagatttgg gggttcgtgt gtgcgagaaa 
cctcaggccg tgatgggctc ttcatacgga 
ttcctggtga atgcctggaa agcgaagaaa 
tgttttgact caacggtcac tgagaatgac 
tgtgacttgg cccccgaagc cagacaggcc 
gggggccccc tgactaattc taaagggcag 
ggtgtactga cgaccagctg cggtaatacc 
tgtcgagctg cgaagctcca ggactgcacg 
atctgtgaaa gcgcggggac ccaagaggac 
atgactagat actctgcccc ccctggggac 
ataacatcat gctcctccaa tgtqtcagtc 
tatctcaccc gtgaccccac cacccccctt 
actccagtca attcctggct aggcaacatc 
atgatcctga tgactcattt cttctccatc 
ctagattgtc agatctacgg ggcctgttac 
attcaacgac tccatggcct tagcgcattt 
aatagggtgg cttcatgcct caggaaactt 



atacggctaa agcctacgct gcacgggcca 3600 
caaaacgagg ttactaccac acaccccata 3660 
gacctggagg tcgtcacgag cacctgggtg 3720 
gcgtattgcc tgacaacagg cagcgtggtc 3780 
ccggccatca ttcccgacag ggaagtcctt 3840 
gcctcacacc tcccttacat cgaacaggga 3900 
gcaatcgggt tgctgeaaac agccaccaag 3960 
tccaagtggc ggaccatcga agccttctgg 4020 
atacaatatt tagcaggctt gtccactctg 4 080 
gcattcacag cctctatcac cagcccgctc 4140 
ctggggggat gggtggccgc ccaacttgct 4200 
gccggcatcg ctggageggc tgttggcagc 4260 
ttggcaggtt atggagcagg ggtggcaggc 4320 
gagatgccct ccaccgagga cctggttaac 4380 
ctagtcgtcg gggtcgtgtg cgcagcgata 4440 
gctgtgcagt ggatgaaccg gctgatagcg 4500 
acgcactatg tgcctgagag cgacgctgca 4560 
accatcactc agctgctgaa gaggcttcac 4620 
tgctccggct cgtggctaag agatgtttgg 4680 
aagacctggc tccagtccaa gctcctgccg 4740 
caacgtgggt acaagggagt ctggcggggc 4800 
ggggcacaga tcaccggaca tgtgaaaaac 4860 
tgtagtaaca cgtggcatgg aacattcccc 4 920 
ccctccccgg cgccaaatta ttctagggcg 4980 
gaggttacgc gggtggggga tttccactac 5040 
tgcccgtgtc aggttccggc ccccgaattc 5100 
aggtacgctc cagcgtgcaa acccctccta 5160 
aatcaatacc tggttgggtc acagctccca 5220 
acttccatgc tcaccgaccc ctcccacatt 5280 
aggggatctc ctcccccctt ggccagctca 5340 
aaggcaacat gcactacccg tcatgactcc 5400 
ctgtggcggc aggagatggg cgggaacatc 5460 
attttggact ctttcgagcc gctccaagcg 5520 
gcggagat.cc tgcggaggtc caggaaattc 5580 
gattacaacc ctccactgtt agagtcctgg 5640 
cacgggtgtc cattgccgcc tgccaaggcc 5700 
acggttgtcc tgtcagaatc taccgtgtct 5760 
ttcggcagct ccgaatcgtc ggccgtcgac 5820 
ccctccgacg acggcgacgc gggatccgac 5880 
gagggggagc cgggggatcc cgatctcagc 5940 
gct.agt.gagg acgtcgtctg ctgctcgatg 6000 
ccatgcgctg cggaggaaac caagctgccc 6060 
caccacaact tggtctatgc tacaacatct 6120 
acctttgaca gactgcaggt cctggacgac 6180 
gcgaaggcgt ccacagttaa ggctaaactt 6240 
cccccacatt cggccagatc taaatttggc 6300 
agcaaggccg ttaaccacat ccgctccgtg 6360 
ccaattgaca ccaccatcat ggcaaaaaat 6420 
ggccgcaagc cagctcgcct tatcgtattc 6480 
atggcccttt acgatgtggt ctccaccctc 6540 
ttccaatact ctcctggaca gcgggtcgag 6600 
tgccctatgg gcttcgcata tgacacccgc 6660 
atccgtgttg aggagtcaat ctaccaatgt 672 0 
ataaggtcgc tcacagagcg gctttacatc 6780 
aactgcggct atcgccggtg ccgcgcgagc 6840 
ctcacatgtt acttgaaggc cgctgcggcc 6900 
atgctcgtat gcggagacga ccttgtcgtt 6960 
gaggcgagcc tacgggcctt cacggaggct 7020 
ccgcccaaac cagaatacga cttggagttg 7080 
gcgcacgatg catctggcaa aagggtgtac 7140 
gcgcgggctg cgtgggagac agctagacac 7200 
atcatgtatg cgcccacctt gtgggcaagg 7260 
cttctagctc aggaacaact tgaaaaagcc 7320 
tccattgagc cacttgacct acctcagatc 7380 
tcactccata gttactctcc aggtgagatc 7440 
ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 

8001 
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<210> 9 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 
<400> 9 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatgggcac gaatcctaaa 
cgccgcccac aggacgtcaa gttcccgggc 
ttgccgcgca ggggccccag gttgggtgtg 
caacctcgtg gaaggcgaca acctatcccc 
gctcagcccg ggtacccctg gcccctctat 
ctcctgtcac cccgtggctc tcggcctagt 
cgcaatttgg gtaaggtcat cgataccctc 
attccgctcg tcggcgcccc cctagggggc 
gttctggagg acggcgtgaa ctatgcaaca 
ttccttttgg ctttgctgtc ctgtttgacc 
gtatccggag tgtaccatgt cacgaacgac 
gcggacatga tcatgcatac ccccgggtgc 
cgctgctggg tagcgctcac tcccacgctc 
acgatacgac gccatgtcga tttgctcgtt 
gtgggagatc tctgcggatc tgttttcctc 
cggcacgaga cagtacagga ctgcaattgc 
cgtatggctt gggatatgat gatgaactgg 
ttactccgga tcccacaagc tgtcgtggat 
gcgggccttg cctactattc catggtgggg 
ctctttgccg gcgttgacgg gggaacctat 
ctcgggatta cgtccctctt ttcacccggg 
aacggcagct ggcacatcaa caggactgcc 
ttccttgctg cgctgttcta cgtgcacaag 
gccagctgca gccccatcga cgcgttcgct 
tcacacagct cggaccagag gccttattgt 
gtacccgcgg cgcaggtgtg tggtccagtg 
gggacgaccg accggttcgg cgtccctacg 
ctgcttctta acaacacgcg gccgccgcaa 
agcactgggt tcaccaagac gtgcgggggc 



tcccctgtga ggaactactg 60 
tgtcgtgcag cctccaggac 120 
gagtacaccg gaattgccag 160 
ggagatttgg gcgtgccccc 240 
ttgtggtact gcctgatagg 300 
catgagcacg aatcctaaac 360 
gattgaacaa gatggattgc 420 
ctatgactgg gcacaacaga 460 
gcaggggcgc ccggttcttt 540 
ggacgaggca gcgcggctat 600 
cgacgttgtc actgaagcgg 660 
tctcctgtca tctcaccttg 720 
gcggctgcat acgcttgatc 760 
cgagcgagca cgtactcgga 640 
gcatcagggg ctcgcgccag 900 
cgaggatctc gtcgtgaccc 960 
ccgcttttct ggattcatcg 1020 
agcgttggct acccgtgata 1080 
cgtgctttac ggtatcgccg 1140 
cgagttcttc tgagtttaaa 1200 
cctctccctc ccccccccct 1260 
cgtttgtcta tatgttattt 1320 
aacctggccc tgtcttcttg 1380 
tgcaaggtct gttgaatgtc 1440 
caacgtctgt agcgaccctt 1500 
gcggccaaaa gccacgtgta 1560 
ttgtgagttg gatagttgtg 1620 
ggctgaagga tgcccagaag 1680 
catgctttac atgtgtttag 1740 
cgtggttttc ctttgaaaaa 1800 
aaaccaaacg taacaccaac 1860 
tcgtcggtgg agtttacctg 1920 
ggaagacttc cgagcggtcg 1980 
agcccgaggg tagggcctgg 2040 
gcttggggtg ggcaggatgg 2100 
cggacccccg gcgtaggtcg 2160 
tcgccgatct catggggtac 2220 
ccctggcgca tggcgtccgg 2280 
ccggttgctc cttttctatc 2340 
ccgcttatga agtgcgcaac 2400 
caagcattgt gtatgaggca 2460 
ttcgggagaa caactcctcc 2520 
acgctagcgt ccccactacg 2560 
ctctctgctc cgctatgtac 2640 
tgttcacctt ctcgcctcgc 2700 
ccggccacgt gacaggtcac 2760 
cagccctagt ggtatcgcag 2820 
gggcccattg gggagtccta 2860 
aggttctgat tgtgatgcta 2940 
ggacgatggc caaaaacacc 3000 
aaatccagct tgtaaacacc 3060 
atgactccct caacactggg 3120 
ctggatgccc agagcgcatg 3180 
ggcccatcac ttacaatgag 3240 
caccccggcc gtgcggtatc 3300 
ccccaagccc tgtcgtggtg 3360 
gggagaatga gacggacgtg 3420 
ttggctgtac atggatgaat 34 80 
acatcggggg gatcggcaat 3540 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacgggga 
cctcaaagaa 
ggtggtcaga 
cgcgcgacta 
aaggctcgcc 
ggcaatgagg 

tggggcccca 

acgtgcggct 
gctgccaggg 
gggaatctgc 
atcccagctt 
tgctccaacg 
gtgccctgcg 
gcggccagga 
ggggcggctg 
gtcgcccagc 
tcaatatatc 
tcacctacag 
atggtggcgg 
aactgggcta 
gtgacagggg 
tcatcccaga 
ctgaactgca 
ttcaactcat 
caggggtggg 
tggcactacg 
tactgcttca 
tacagttggg 
ggcaactggt 
cccccgtgta 
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aaaaccttga cctgccccac ggactgcttc 
tgtggfctcgg ggccttggtt gacacccaga 
cactacccct gcactgtcaa ctttaccatc 
gagcacaggc tcgaagccgc atgcaattgg 
agggacagat cagagcttag cccgctgctg 
tgttccttca ccaccctacc ggctctgtcc 
gtggacgtac aatacctgta cggtataggg 
gagtatgtcc tgttgctctt ccttcttctg 
atgatgctgc tgatagctca agctgaggcc 
gcatccgtgg ccggggcgca tggcattctc 
tacatcaagg gcaggctggt ccctggggcg 
ctcctgctcc tgctggcgtt accaccacga 
tcgtgcggag gcgcggtttt cgtaggtctg 
ctgttcctcg ctaggctcat atggtggtta 
ttgcaagtgt ggatcccccc cctcaacgtt 
acgtgcgcga tccacccaga gctaatcttt 
ggtccactca tggtgctcca ggctggtata 
gggctcattc gtgcatgcat gctggtgcgg 
gctctcatga agttggccgc actgacaggt 
cgggactggg cccacgcggg cctacgagac 
tctgatatgg agaccaaggt tatcacctgg 
atcttgggcc tgcccgtctc cgcccgcagg 
agccttgaag ggcaggggtg gcgactcctc 
cgaggcctac ttggctgcat catcactagc 
ggggaggtcc aagtggtctc caccgcaaca 
gtgtgttgga ctgtctatca tggtgccggc 
atcacccaaa tgtacaccaa tgtggaccag 
gcgcgttcct tgacaccatg cacctgcggc 
gccgatgtca ttccggtgcg ccggcggggc 
cccgtctcct acttgaaggg ctcttcgggc 
gtgggcatct ttcgggctgc cgtgtgcacc 
cccgtcgagt ctatggaaac cactatgcgg 
ccggccgtac cgcagacatt ccaggtggcc 
agcactaagg tgccggctgc gtatgcagcc 
tccgtcgccg ccaccctagg tttcggggcg 
aacatcagaa tcggggtaag gaccatcacc 
ggcaagtttc ttgccgacgg tggttgctct 
gagtgccact caactgactc gaccactatc 
gagacggctg gagcgcgact cgtcgtgctc 
gtgccacatc caaacatcga ggaggtggct 
ggcaaagcca tccccatcga gaccatcaag 
aagaagaaat gtgatgagct cgccgcgaag 
tattaccggg gccttgatgt atccgtcata 
acggacgctc taatgacggg ctttaccggt 
tgtgtcaccc agacagtcga cttcagcctg 
gtgccacaag acgcggtgtc acgctcgcag 
ggcatttaca ggtttgtgac tccaggagaa 
ctgtgcgagt gctatgacgc gggctgtgct 
gttaggttgc gggcttacct aaacacacca 
ttctgggaga gcgtctttac aggcctcacc 
aagcaggcag gagacaactt cccctacctg 
gctcaggctc cacctccatc gtgggaccaa 
acgctgcacg ggccaacgcc cctgctgtat 
accacacacc ccataaccaa atacatcatg 
acgagcacct gggtgctggt aggcggagtc 
acaggcagcg tggtcattgt gggcaggatc 
gacagggaag tcctttaccg ggagttcgat 
tacatcgaac agggaatgca gctcgccgaa 
caaacagcca ccaagcaagc ggaggctgct 
atcgaagcct tctgggcgaa gcatatgtgg 
ggcttgtcca ctctgcctgg caaccccgcg 
atcaccagcc cgctcaccac ccaacatacc 
gccgcccaac ttgctcctcc cagcgctgct 
gcggctgttg gc.agcatagg ccttgggaag 
gcaggggtgg caggcgcgct cgtggccttt 
gaggacctgg ttaacctact ccctgctatc 



cggaagcacc ccgaggccac ttacaccaag 3600 
tgcttggtcc actacccata caggctttgg 3660 
ttcaaggtta ggatgtacgt ggggggagtg 3720 
actcgaggag agcgttgtaa cctggaggac 3780 
ctgtctacaa cggagtggca ggtattgccc 3840 
actggtttga tccatctcca tcagaacgtc 3900 
tcggcggttg tctcctttgc aatcaaatgg 3960 
gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
gccctagaga acctggtggt cctcaacgcg 4080 
tccttcctcg tgttcttctg tgctgcctgg 4140 
gcatatgccc tctacggcgt atggccgcta 4200 
gcatacgcca tggaccggga gatggcagca 4260 
atactcttga ccttgtcacc gcactataag 4320 
caatatttta tcaccagggc cgaggcacac 4380 
cgggggggcc gcgatgccgt catcctcctc 4440 
accatcacca aaatcttgct cgccatactc 4500 
accaaagtgc cgtacttcgt gcgcgcacac 4560 
aaggttgctg ggggtcatta tgtccaaatg 4620 
acgtacgttt atgaccatct caccccactg 4680 
cttgcggtgg cagttgagcc cgtcgtcttc 4740 
ggggcagaca ccgcggcgtg tggggacatc 4800 
gggagggaga tacatctggg accggcagac 4860 
gcgcctatta cggcctactc ccaacagacg 4920 
crtcacaggcc gggacaggaa ccaggtcgag 4980 
caatctttcc tggcgacctg cgtcaatggc 5040 
tcaaagaccc ttgccggccc aaagggccca 5100 
gacctcgtcg gctggcaagc gccccccggg 5160 
agctcggacc tttacttggt cacgaggcat 5220 
gacagcaggg ggagcctact ctcccccagg 5280 
ggtccactgc tctgcccctc ggggcacgct 5340 
cgaggggttg cgaaggcggt ggactttgta 5400 
tccccggtct tcacggacaa ctcgtcccct 5460 
catctacacg cccctactgg tagcggcaag 5520 
caagggtata aggtgcttgt cctgaacccg 5580 
tatatgtcta aggcacatgg tatcgaccct 5640 
acgggtgccc ccatcacgta ctccacctat 5700 
gggggcgcct atgacatcat aatatgtgat 5760 
ctgggcatcg gcacagtcct ggaccaagcg 5820 
gccaccgcta cgcctccggg atcggtcacc 5880 
ctgtccagca ctggagaaat ccccttttat 5940 
ggggggaggc acctcatttt ctgccattcc 6000 
ctgtccggcc tcggactcaa tgctgtagca 6060 
ccaactagcg gagacgtcat tgtcgtagca 6120 
gacttcgact cagtgatcga ctgcaataca 6180 
gacccgacct tcaccattga gacgacgacc 6240 
cggcgaggca ggactggtag gggcaggatg 6300 
cggccctcgg gcatgttcga ttcctcggtt 6360 
tggtacgagc tcacgcccgc cgagacctca 6420 
gggttgcccg tctgccagga ccatctggag 6480 
cacatagacg cccatttctt gtcccagact 6540 
gtagcatacc aggctacggt gtgcgccagg 6600 
atgtggaagt gtctcatacg gctaaagcct 6660 
aggctgggag ccgttcaaaa cgaggttact 6720 
gcatgcatgt cggctgacct ggaggtcgtc 6780 
ctagcagctc tggccgcgta ttgcctgaca 6840 
atcttgtccg gaaagccggc ca tea ttccc 6900 
gagatggaag agtgcgcctc acacctccct 6960 
caattcaaac agaaggcaat cgggttgctg 7020 
gctcccgtgg tggaatccaa gtggcggacc 7080 
aatttcatca gcgggataca atatttagca 7140 
atagcatcac tgatggcatt cacagcctct 7200 
ctcctgttta acatcctggg gggatgggtg 7260 
tctgctttcg taggcgccgg catcgctgga 7320 
gtgcttgtgg atattttggc aggttatgga 7380 
aaggtcatga gcggcgagat gccctccacc 7440 
ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag cgatactgcg tcggcacgtg ggcccagggg agggggctgt gcagtggatg 7560 
aaccggctga tagcgttcgc ttcgcggggt aaccacgtct cccccacgca ctatgtgcct 7620 
gagagcgacg ctgcagcacg tgtcactcag atcctctcta gtcttaccat cactcagctg 7680 
ctgaagaggc ttcaccagtg gatcaacgag gactgctcca cgccatgctc cggctcgtgg 7740 
ctaagagatg tttgggattg gatatgcacg gtgttgactg atttcaagac ctggctccag 7800 
tccaagctcc tgccgcgatt gccgggagtc cccttcttct catgtcaacg tgggtacaag 7860 
ggagtctggc ggggcgacgg catcatgcaa accacctgcc catgtggggc acagatcacc 7920 
ggacatgtga aaaacggttc catgaggatc gtggggccta ggacctgtag taacacgtgg 7980 
catggaacat tccccattaa cgcgtacacc acgggcccct gcacgccctc cccggcgcca 8040 
aattattcta gggcgctgtg gcgggtggct gctgaggagt acgtggaggt tacgcgggtg 8100 
ggggatttcc actacgtgac gggcatgacc actgacgacg taaagtgccc gtgtcaggtt 8160 
ccggcccccg aattcttcac agaagtggat ggggtgcggt tgcacaggta cgctccagcg 8220 
tgcaaacccc tcctacggga ggaggtcaca ttcctggtcg ggctcaatca atacetggtt 8280 
gggtcacagc tcccatgcga gcccgaaccg gatgtagcag tgctcacttc catgctcacc 8340 
gacccctccc acattacggc ggagacggct aagcgtaggc tggccagggg atctcctccc 8400 
cccttggcca gctcatcagc tagccagctg tctgcgcctt ccttgaaggc aacatgcact 8460 
acccgtcatg actccccgga cgctgacctc atcgaggcca acctcctgtg gcggcaggag 8520 
atgggcggga acatcacccg cgtggagtca gaaaataagg tagtaatttt ggactctttc 8580 
gagccgctcc aagcggagga ggatgagagg gaagtatccg ttccggcgga gatcctgcgg 8640 
aggtccagga aattccctcg agcgatgccc atatgggcac gcccggatta caaccctcca 8700 
ctgttagagt cctggaagga cccggactac gtccctccag tggtacacgg gtgtccattg 8760 
ccgcctgcca aggcccctcc gataccacct tcacggagga agaggacggt tgtcctgtca 8820 
gaatctaccg tgtcttctgc cttggcggag ctcgccacag agaccttcgg cagctccgaa 8880 
tcgtcggccg tcgacagcgg cacggcaacg gcctctcctg accagccctc cgacgacggc 8940 
gacgcgggat ccgacgttga gtcgtactcc tccatgcccc cccttgaggg ggagccgggg 9000 
gatcccgatc tcagcgacgg gtcttggtct accgtaagcg aggaggctag tgaggacgtc 9060 
gtctgctgct cgatgtccta cacatggaca ggcgccctga tcacgccatg cgctgcggag 9120 
gaaaccaagc tgcccatcaa tgcactgagc aactctttgc tccgt caeca caacttggtc 9180 
tatgetacaa catctcgcag cgcaagcctg eggcagaaga aggtcacctt tgacagactg 9240 
caggtcctgg acgaccacta ccgggacgtg ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gttaaggcta aacttctatc cgtggaggaa gectgtaage tgacgccccc acattcggcc 9360 
agatctaaat ttggctatgg ggcaaaggac gtccggaacc tatccagcaa ggccgttaac 9420 
cacatccgct ccgtgtggaa ggacttgctg gaagacactg agacaccaat tgacaccacc 9480 
atcatggcaa aaaatgaggt tttctgcgtc caaccagaga aggggggecg caagccagct 9540 
cgccttatcg tattcccaga tttgggggtt cgtgtgtgcg agaaaatggc cctttacgat 9600 
gtggtctcca ccctccctca ggccgtgatg ggctcttcat aeggattcca atactctcct 9660 
ggacagcggg tcgagttcct ggtgaatgcc tggaaagega agaaatgece tatgggcttc 9720 
gcatatgaca cccgctgttt tgactcaacg gtcactgaga atgacatccg tgttgaggag 9780 
tcaatctacc aatgttgfcga cttggccccc gaagecagae aggecataag gtcgctcaca 9840 
gageggcttt acateggggg ccccctgact aattctaaag ggcagaactg cggctatcgc 9900 
cggtgccgcg cgagcggtgt actgacgacc agetgeggta ataccctcac atgttacttg 9960 
aaggccgctg cggcctgtcg agetgegaag ctccaggact geacgatget cgtatgcgga 10020 
gacgaccttg tcgttatctg tgaaagcgcg gggacccaag aggacgaggc gagectaegg 10080 
gccttcacggr aggctatgac tagatactct gccccccctg gggacccgcc caaaccagaa 10140 
tacgacttgg agttgataac atcatgctcc tccaatgtgt cagtcgcgca egatgeatet 10200 
ggcaaaaggg tgtactatct cacccgtgac cccaccaccc cccttgcgcg ggctgcgtgg 10260 
gagacagcta gacacactcc agtcaattcc tggctaggca acatcatcat gtatgcgccc 10320 
accttgtggg caaggatgat cctgatgact catttcttct ccatccttct agctcaggaa 10380 
caacttgaaa aagecctaga ttgtcagatc taeggggect gttactccat tgagecaett 1044O 
gacctacctc agatcattca acgactccat ggccttagcg cattttcact ccatagttac 10500 
tctccaggtg agatcaatag ggtggcttca tgcctcagga aacttggggt accgcccttg 10560 
cgagtctgga gaeateggge cagaagtgtc cgcgctaggc tactgtccca gggggggagg 10620 
gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 
ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 10740 
ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctactc 10800 
ctactttctg taggggtagg catctatcta ctccccaacc gatgaaeggg gagctaaaca 10860 
ctccaggcca ataggecate ctgttttttt cccttttttt ttttcttttt tttttttttt 10920 
tttttttttt tttttttttc tccttttttt ttcctctttt tttccttttc tttcctttgg 10980 
tggctccatc ttagecctag teaeggctag ctgtgaaagg tccgtgagcc gettgactge 11040 
agagagtget gatactggee tetctgeaga tcaagt 11076 



55 



EP 1 043 399 A2 



<210> 10 
<211> 8001 
<212> DMA 

<213> Hepatitis C Virus 
<400> 10 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgcccec 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttfc 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 
cggctacctg cccattcgac caecaagcga aacatcgcat cgagcgagca cgtactcgga 840 
tggaagccgg tcttgtcgat caggatgate tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatetc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaccacaa cggtttccct ctagcgggat caattccgcc cctctccctc ccccccccct 1260 
aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 
acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcrttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 
gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 
tegaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 
cacgataata ccatggcgcc tattacggcc tactcccaac agacgcgagg cctacttggc 1860 
tgcatcatca ctagcctcac aggccgggac aggaaccagg tcgaggggga ggtccaagtg 1920 
gtctccaccg caacacaatc tttcctggcg acctgcgtca atggcgtgtg ttggactgtc 1980 
tatcatggtg ccggctcaaa gacccttgcc ggcccaaagg gcccaatcac ccaaatgtac 2040 
accaatgtgg accaggacct cgtcggetgg caagcgcccc ccggggcgcg ttccttgaca 2100 
ccatgcacct gcggcagctc ggacctttac ttggtcacga ggcatgccga tgtcattccg 2160 
gtgcgccggc ggggcgacag cagggggagc ctactctccc ccaggcccgt ctcctacttg 2220 
aagggctctt cgggcggtcc actgctctgc ccctcggggc acgctgtggg catctttcgg 2280 
gctgccgtgt gcacccgagg ggttgcgaag gcggtggact ttgtacccgt cgagtctatg 2340 
ggaaccacta tgcggtcccc ggtcttcacg gacaactcgt cccctccggc cgtaccgcag 2400 
acattccagg tggcccatct acacgcccct actggtagcg gcaagagcac taaggtgccg 2460 
gctgcgtatg caggccaagg gtataaggtg cttgtcctga acccgtccgt cgccgccacc 2520 
ctaggtttcg gggcgtatat gtctaaggca catggtatcg accctaacat cagaatcggg 2580 
gtaaggacca tcaccacggg tgcccccatc acgtactcca cctatggcaa gtttcttgcc 2640 
gacggtggtt gctctggggg cgcctatgac atcataatat gtgatgagtg ccactcaact 2700 
gactcgacca ctatcctggg catcggcaca gtcctggacc aagcggagac ggctggagcg 2760 
cgactcgtcg tgctcgccac cgctaegcct ccgggatcgg tcaccgtgcc acatccaaac 2820 
atcgaggagg tggctctgtc cagcactgga gaaatcccct tttatggcaa agccatcccc 2880 
atcgagacca tcaagggggg gaggcacctc attttctgcc attccaagaa gaaatgtgat 2940 
gagctcgccg cgaagctgtc cggcctcgga ctcaatgctg tagcatatta ccggggcctt 3000 
gatgtatccg tcatacccrac tagcggagac gtcattgtcg tagcaacgga cgctctaatg 3060 
acgggcttta ccggcgactt cgactcagtg atcgactgca atacatgtgt cacccagaca 3120 
gtcgacttca gcctggaccc gaccttcacc attgagacga cgaccgtgcc acaagacgcg 3180 
gtgtcacgct cgcagcggcg aggcaggact ggtaggggca ggatgggcat ttacaggttt 3240 
gtgactccag gagaacggcc ctcgggcatg ttcgattcct cggttctgtg cgagtgctat 3300 
gacgcgggct gtgcttggta cgagctcacg cccgccgaga cctcagttag gttgcgggct 3360 
tacctaaaca caccagggtt gcccgtctgc caggaccatc tggagttctg ggagagcgtc 3420 
tttacaggcc tcacccacat agacgcccat ttcttgtccc agactaagca ggcaggagac 34 80 
aacttcccct acctggtagc ataccaggct acggtgtgcg ccagggctca ggctccacct 354 0 
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ccatcgtggg accaaatgtg gaagtgtctc 
acgcccctgc tgtataggct gggagccgtt 
accaaataca tcatggcatg catgtcggct 
ctggtaggcg gagtcctagc agctctggcc 
attgtgggca ggatcatctt gtccggaaag 
taccgggagt tcgatgagat ggaagagtgc 
atgcagctcg ccgaacaatt caaacagaag 
caagcggagg ctgctgctcc cgtggtggaa 
gcgaagcata tgtggaattt catcagcggg 
cctggcaacc ecgcgatagc atcactgatg 
accacccaac ataccctcct gtttaacatc 
cctcccagcg ctgcttctgc tttcgtaggc 
ataggecttg ggaaggtgct tgtggatatt 
gcgctcgtgg cctttaaggt catgagcggc 
ctactccctg ctatcctctc ccctggcgcc 
ctgcgtcggc acgtgggccc aggggagggg 
ttcgcttcgc ggggtaacca cgtctccccc 
gcacgagtca ctcagatcct ctctagtctt 
cagtggatca acgaggactg ctccacgcca 
gattggatat gcacggtgtt gactgatttc 
cgattgccgg gagtcccctt cttctcatgt 
gacggcatca tgcaaaccac ctgcccatgt 
ggttccatga ggatcgtggg gcctaggacc 
attaacgcgt acaccacggg cccctgcacg 
ctgtggcggg taggtgctga ggagtacgtg 
gtgacgggca tgaccactga caacgtaaag 
ttcacagaag fcggatggggt gcggttgcac 
cgggaggagg tcacattcct ggtcgggctc 
tgcgagcctg aaccggatgt: agcagtgctc 
acggcggaga cggctaagcg taggctggcc 
tcagctagcc agctgtctgc gccttccttg 
ccggacgctg acctcatcga ggccaacctc 
acccgcgtgg agtcagaaaa taaggtagta 
gaggaggatg agaggggagt atccgttccg 
cctcgagcga tgcccatatg ggcacgcccg 
aaggacccgg actacgtccc tccagtggta 
cctccgatac caccttcacg gaggaagagg 
tctgccttgg cggagctcgc cacagagacc 
agcggcacgg caacggcctc tcctgaccag 
gttgagtcgt actcctccat gccccccctt 
gacgggtctt ggtctaccgt aagcgaggag 
tcctacacat ggacaggcgc cctgatcacg 
atcaatgcac tgagcaactc tttgctccgt 
cgcagcgcaa acctgcggca gaagaaggtc 
cactaccggg acgtgctcaa ggagatgaag 
ctatccgtgg aggaagcctg taagctgacg 
tatggggcaa aggacgtccg gaacctatcc 
tggaaggact tgctggaaga cactgagaca 
gaggttttct gcgtccaacc agagaagggg 
ccagatttgg gggttcgtgt gtgcgagaaa 
cctcaggccg tgatgggcto ttcatacgga 
ttcctggtga atgcctggaa agcgaagaaa 
tgttttgact caacggtcac tgagaatgac 
tgtgacttgg cccccgaagc cagacaggcc 
gggggccccc tgactaattc taaagggcag 
ggtgtactga cgaccagctg cggtaatacc 
tgtcgagctg cgaagctcca ggactgcacg 
atctgtgaaa gcgcggggac ccaagaggac 
atgactagat actctgcccc ccctggggac 
ataacatcat gctcctccaa tgtgrtcagtc 
tatctcaccc gtgaccccac cacccccctt 
actccagtca attcctggct aggcaacatc 
atgatcctga tgactcattt cttctccatc 
ctagattgtc agatctacgg ggcctgttac 
attcaacgac tccatggcct tagcgcattt 
aatagggtgg cttcatgcct caggaaactt 



atacggctaa agcctacgct gcacgggcca 3600 
caaaacgagg ttactaccac acaccccata 3660 
gacctggagg tcgtcacgag cacctgggtg 3720 
gcgtattgcc tgacaacagg cagcgtggtc 3780 
ccggccatca ttcccgacag ggaagtcctt 3840 
gcctcacacc tcccttacat cgaacaggga 3900 
gcaatcgggt tgctgcaaac agccaccaag 3960 
tccaagtggc ggaccatcga agccttctgg 4020 
atacaatatt tagcaggctt gtccactctg 4080 
gcattcacag cctctatcac cagcccgctc 4140 
ctggggggat gggtggccgc ccaacttgct 4200 
gccggcatcg ctggagcggc tgttggcagc 4260 
ttggcaggtt atggagcagg ggtggcaggc 4320 
gagttgccct ccaccgagga cctggttaac 4380 
ctagtcgtcg gggtcgtgtg cgcagcgata 4440 
gctgtgcagt ggatgaaccg gctgatagcg 4500 
acgcactatg tgcctgagag cgacgctgca 4560 
accatcactc agctgctgaa gaggcttcac 4620 
tgctccggct cgtggctaag agatgtttgg 4680 
aagacctggc tccagtccaa getcetgccg 4740 
caacgtgggt acaagggagt ctggcggggc 4800 
ggagcacaga tcaccggaca tgtgaaaaac 4 860 
tgtagtaaca cgtggcatgg aacattcccc 4920 
ccctccccgg cgccaaatta ttctagggcg 4980 
gaggttacgc gggtggggga tttccactac 5040 
tgcccgtgtc aggttccggc ccccgaafctc 5100 
aggtacgctc cagcgtgcaa acccctccta 5160 
aatcaatacc tggttgggtc acagctccca 5220 
acttccatgc tcaccgaccc ctcccacatt 5280 
aggggatctc cccccccctt ggccagctca 5340 
aaggcaacat gcactacccg tcatgactcc 5400 
ctgtggcggc aggagatggg cgggaacatc 5460 
attttggact ctttcgagcc gctccaagcg 5520 
gcggagatcc tgcggaggtc caggaaattc 5580 
gattacaacc ctccactgtt agagtcctgg 5640 
cacgggtgtc cattgccgcc tgccaaggcc 5700 
acggttgtcc tgtcagaatc taccgtgtct 5760 
ttcggcagct ccgaatcgtc ggccgtcgac 5820 
ccctccgacg acggcgacgc gggatccgac 5880 
gagggggagc cgggggatcc cgatctcagc 5940 
gctagtgagg acgtcgtctg ctgctcgatg 6000 
ccatgcgctg cggaggaaac caagctgccc 6060 
caccacaact tggtctatgc tacaacatct 6120 
acctttgaca gactgcaggt cctggacgac 6180 
gcgaaggcgt ccacagttaa ggctaaactt 6240 
cccccacatt cggccagatc taaatttggc 6300 
agcaaggccg ttaaccacat ccgctccgtg 6360 
ccaattgaca ccaccatcat ggcaaaaaat 6420 
ggccgcaagc cagctcgcct, tatcgtattc 6480 
atggcccttt acgatgtggt ctccaccctc 6540 
ttccaatact ctcctggaca gcgggtcgag 6600 
tgccctatgg gcttcgcata tgacacccgc 6660 
atccgtgttg aggagtcaat ctaccaatgt 6720 
ataaggtcgc tcacagagcg gctttacatc 6780 
aactgcggct atcgccggtg ccgcgcgagc 6840 
ctcacatgtt acttgaaggc cgctgcggce 6900 
atgctcgtat gcggagacga ccttgtcgtt 6960 
gaggcgagcc tacgggcctt cacggaggct 7020 
ccgcccaaac cagaatacga cttggagttg 7080 
gcgcacgatg catctggcaa aagggtgtac 7140 
gcgcgggctg cgtgggagac agctagacac 7200 
atcatgtatg cgcccacctt gtgggcaagg 7260 
cttctagctc aggaacaact tgaaaaagcc 7320 
tccattgagc cacttgacct acctcagatc 7380 
tcactccata gttactctcc aggtgagatc 7440 
ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg tcccaggggg ggagggctgc cacttgtggc 7560 

aagtacctct tcaactgggc agtaaggacc aagctcaaac tcactccaat cccggctgcg 7620 

tcccagttgg atttatccag ctggttcgtt gctggttaca gcgggggaga catatatcac 7680 

agcctgtctc gtgcccgacc ccgctggttc atgtggtgcc tactcctact ttctgtaggg 7740 

gtaggcatct atctactccc caaccgatga acggggagct aaacactcca ggccaatagg 7800 

ccatcctgtt tttttccctt tttttttttc tttttttttt tttttttttt tttttttttt 7860 

ttttctcctt tttttttcct ctttttttcc ttttctttcc tttggtggct ccatcttagc 7920 

cctagtcacg gctagctgtg aaaggtccgt gagccgcttg actgcagaga gtgctgatac 7980 

tggcctctct gcagatcaag t 8001 
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<210> 11 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 
<400> 11 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatgggcac gaatcctaaa 
cgccgcccac aggacgtcaa gttcccgggc 
ttgccgcgca ggggccccag gttgggtgtg 
caacctcgtg gaaggcgaca acctatcccc 
gctcagcccg ggtacccctg gcccctctat 
ctcctgtcac cccgtggctc tcggcctagt 
cgcaatttgg gtaaggtcat cgataccctc 
attccgctcg tcggcgcccc cctagggggc 
gttctggagg acggcgtgaa ctatgcaaca 
ttccttttgg ctttgctgtc ctgtttgacc 
gtatccggag tgtaccatgt cacgaacgac 
gcggacatga tcatgcatac ccccgggtgc 
cgctgctggg tagcgctcac tcccacgctc 
acgatacgac gccatgtcga tttgctcgtt 
gtgggagatc tctgcggatc tgttttcctc 
cggcacgaga cagtacagga ctgcaattgc 
cgtatggctt gggatatgat gatgaactgg 
ttactccgga tcccacaagc tgtcgtggat 
gcgggccttg cctactattc catggtgggg 
ctctttgccg gcgttgacgg gggaacctat 
ctcgggatta cgtccctctt ttcacccggg 
aacggcagct ggcacatcaa caggactgcc 
ttccttgctg cgctgttcta cgtgcacaag 
gccagctgca gccccatcga cgcgttcgct 
tcacacagct cggaccagag gccttattgt 
gtacccgcgg cgcaggtgtg tggtccagtg 
gggacgaccg accggttcgg cgtccctacg 
ctgcttctta acaacacgcg gccgccgcaa 
agcactgggt tcaccaagac gtgcgggggc 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgccccc. 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgecat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 4 80 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgcg gcggctgcat acgcttgatc 780 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc eeccccccet 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1B00 
cctcaaagaa aaaccaaacg taacaccaac 1860 
ggtggtcaga tcgtcggtgg agtttacctg 1920 
cgcgcgacta ggaagacttc cgagcggtcg 198 0 
aaggctcgcc agcccgaggg tagggcctgg 2040 
ggcaatgagg gcttggggtg ggcaggatgg 2100 
tggggcccca cggacccccg gcgtaggtcg 2160 
acgtgcggct tcgccgatct catggggtac 2220 
gctgccaggg ccctggcgca tggcgtccgg 2280 
gggaatctgc ccggttgctc cttttctatc 2340 
atcccagctt ccgcttatga agtgcgcaac 2400 
tgctccaacg caagcattgt gtatgaggca 2460 
gtgccctgcg ttcgggagaa caactcctcc 2520 
gcggccagga acgctagcgt ccccactacg 2580 
ggggcggctg ctctctgctc cgctatgtac 2640 
gtcgcccagc tgttcacctt ctcgcctcgc 2700 
tcaatatatc ccggccacgt gacaggtcac 2760 
tcacctacag cagccctagt ggtatcgcag 2820 
atggtggcgg gggcccattg gggagtccta 2880 
aactgggcta aggttctgat tgtgatgcta 2940 
gtgacagggg ggacgatggc caaaaacacc 3000 
tcatcccaga aaatccagct tgtaaacacc 3060 
ctgaactgca atgactccct caacactggg 3120 
ttcaactcat ctggatgccc agagcgcatg 3180 
caggggtggg ggcccatcac ttacaatgag 324 0 
tggcactacg caccccggcc gtgcggtatc 3300 
tactgcttca ccccaagccc tgtcgtggtg 3360 
tacagttggg gggagaatga gacggacgtg 3420 
ggcaactggt ttggctgtac atggatgaat 34 80 
cccccgtgta acatcggggg gatcggcaat 3540 
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aaaaccttga cctgccccac ggactgcttc 
tgtggttcgg ggccttggtt gacacccaga 
caetacccct gcactgtcaa ctttaccatc 
gagcacaggc tcgaagccgc atgcaattgg 
agggacagat cagagcttag cccgctgctg 
tgttccttca ccaccctacc ggctctgtcc 
gtggacgtac aatacctgta cggtataggg 
gagtatgtcc tgttgctctt ccttcttctg 
atgatgctgc tgatagctca agctgaggcc 
gcatccgtgg ccggggcgca tggcattctc 
tacatcaagg gcaggctggt ccctggggcg 
ctcctgctcc tgctggcgtt accaccacga 
tcgtgcggag gcgcggtttt cgtaggtctg 
ctgttcctcg ctaggctcat atggtggtta 
ttgcaagtgt ggatcccccc cctcaacgtt 
acgtgcgcga tccacccaga gctaatcttt 
ggtccactca tggtgctcca ggctggtata 
gggctcattc gtgcatgcat gctggtgcgg 
gctctcatga agttggccgc actgacaggt 
cgggactggg cccacgcggg cctacgagac 
tctgatatgg agaccaaggt tatcacatgg 
atcttgggcc tgcccgtctc cgcccgcagg 
agccttgaag ggcaggggtg gcgactcctc 
cgaggcctac ttggctgcat catcactagc 
ggggaggtcc aagtggtctc caccgcaaca 
gtgtgttgga ctgtctatca tggtgccggc 
atcacccaaa tgtacaccaa tgtggaccag 
gcgcgttcct tgacaccatg cacctgcggc 
gccgatgtca ttccggtgcg ccggcggggc 
cccgtctcct acttgaaggg ctcttcgggc 
gtgggcatct ttcgggctgc cgtgtgcacc 
cccgtcgagt ctatgggaac cactatgcgg 
ccggccgtac cgcagacatt ccaggtggcc 
agcactaagg tgccggctgc gtatgcaggc 
tccgtcgccg ccaccctagg tttcggggcg 
aacatcagaa tcggggtaag gaccatcacc 
ggcaagtttc ttgccgacgg tggttgctct 
gagtgccact caactgactc gaccactatc 
gagacggctg gagcgcgact cgtcgtgctc 
gtgccacatc caaacatcga ggaggtggct 
ggcaaagcca tccccatcga gaccatcaag 
aagaagaaat gtgatgagct cgccgcgaag 
tattaccggg gccttgatgt atccgtcata 
acggacgctc taatgacggg ctttaccggc 
tgtgtcaccc agacagtcga cttcagcctg 
gtgccacaag acgcggtgtc acgctcgcag 
ggcatttaca ggtttgtgac tccaggagaa 
ctgtgcgagt gctatgaegc gggctgtgct 
gttaggttgc gggcttacct aaacacacca 
ttctgggaga gcgtctttac aggcctcacc 
aagcaggcag gagacaactt cccctacctg 
gctcaggctc cacctccatc gtgggaccaa 
acgctgcacg ggccaacgcc cctgctgtat 
accacacacc ccataaccaa atacatcatg 
acgagcacct gggtgctggt aggcggagtc 
acaggcagcg tggtcattgt gggcaggatc 
gacagggaag tcctttaccg ggagttcgat 
tacatcgaac agggaatg'sa gctcgccgaa 
caaacagcca ccaagcaagc ggaggctgct 
atcgaagcct tctgggcgaa gcatatgtgg 
ggcttgtcca ctctgcctgg caaccccgcg 
atcaccagcc cgctcaccac ccaacatacc 
gccgcccaac ttgctcctcc cagcgctgct 
gcggctgttg gcagcatagg ccttgggaag 
gcaggggtgg caggcgcgct cgtggccttt 
gaggacctgg ttaacctact ccctgctatc 



cggaagcacc ccgaggccac ttacaccaag 3600 
tgcttggtcc actacccata caggctttgg 3660 
ttcaaggtta ggatgtacgt ggggggagtg 3720 
actcgaggag agcgttgtaa cctggaggac 3780 
ctgtctacaa cggagtggca ggtattgccc 3640 
actggtttga tccatctcca tcagaacgtc 3900 
tcggcggttg tctcctttgc aatcaaatgg 3960 
gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
gccctagaga acctggtggt cctcaacgcg 4080 
tccttcctcg tgttcttctg tgctgcctgg 414 0 
gcatatgccc tctacggcgt atggccgcta 4200 
gcatacgcca tggaccggga gatggcagca 4260 
atactcttga ccttgtcacc gcactataag 4320 
caatatttta tcaccagggc cgaggcacac 4380 
cgggggggcc gcgatgccgt catcctcctc 4440 
accatcacca aaatcttgct cgccatactc 4500 
accaaagtgc cgtacttcgt gcgcgcacac 4560 
aaggttgctg ggggtcatta tgtccaaatg 4620 
acgtacgttt atgaccatct caccccactg 4680 
cttgcggtgg cagttgagcc cgtcgtcttc 4740 
ggggcagaca ccgcggcgtg tggggacatc 4800 
gggagggaga tacatctggg accggcagac 4860 
gcgcctatta cggcctactc ccaacagacg 4920 
ctcacaggcc gggacaggaa ccaggtcgag 4980 
caatctttcc tggcgacctg cgtcaatggc 5040 
tcaaagaccc ttgccggccc aaagggccca 5100 
gacctcgtcg gctggcaagc gccccccggg 5160 
agctcggacc tttacttggt cacgaggcat S220 
gacagcaggg ggagcctact ctcccccagg 5280 
ggtccactgc tctgcccctc ggggcacgct 5340 
cgaggggttg cgaaggcggt ggactttgta 5400 
tccccggtct tcacggacaa ctcgtcccct 5460 
catctacacg cecctactgg tagcggcaag 5520 
caagggtata aggtgcttgt cctgaacccg 5580 
tatatgtcta aggcacatgg tatcgaccct 5640 
acgggtgccc ccatcacgta ctccacctat 5700 
gggggcgcct atgacatcat aatatgtgat 5760 
ctgggcatcg gcacagtcct ggaccaagcg 5820 
gccaccgcta cgcctccggg atcggtcacc 5880 
ctgtccagca ctggagaaat ccccttttat 5940 
ggggggaggc acctcatttt ctgccattcc 6000 
ctgtccggcc tcggactcaa tgctgtagca 6060 
ccaactagcg gagacgtcat tgtcgtagca 6120 
gacttcgact cagtgatcga ctgcaataca 6180 
gacccgacct tcaccattga gacgacgacc 6240 
cggcgaggca ggactggtag gggcaggatg 6300 
cggccctcgg gcatgttcga ttcctcggtt 6360 
tggtacgagc tcacgcccgc cgagacctca 6420 
gggttgcccg tctgccagga ccatctggag 64 80 
cacatagacg cccatttctt gtcccagact 6540 
gtagcatacc aggctacggt gtgcgccagg 6600 
atgtggaagt gtctcatacg gctaaagcct 6660 
aggctgggag ccgttcaaaa cgaggttact 6720 
gcatgcatgt cggctgacct ggaggtcgtc 6780 
ctagcagctc tggccgcgta ttgcctgaca 684 0 
atcttgtccg gaaagccggc catcattccc 6900 
gagatggaag agtgcgcctc acacctccct 6960 
caattcaaac agaaggcaat cgggttgctg 7020 
gctcccgtgg tggaatccaa gtggcggacc 7080 
a a tt tea tea gcgggataca atatttagca 7140 
atagcatcac tgatggcatt cacagcctct 7200 
ctcctgttta acatcctggg gggatgggtg 7260 
tctgctttcg taggcgccgg catcgctgga 732 0 
gtgcttgtgg atattttggc aggttatgga 7380 
aaggtcatga gcggcgagtt gccctccacc 74 40 
ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag 
aaccggctga 
gagagcgacg 
ctgaagaggc 
ctaagagatg 
tccaagctcc 
ggagtctggc 
ggacatgtga 
catggaacat 
aattattcta 
ggggatttcc 
ccggcccccg 
tgcaaacccc 
gggtcacagc 
gacccctccc 
cccttggcca 
acccgtcatg 
atgggcggga 
gagccgctcc 
aggtccagga 
ctgttagagt 
ccgcctgcca 
gaatctaccg 
tcgtcggccg 
gacgcgggat 
gatcccgatc 
gtctgctgct 
gaaaccaagc 
tatgctacaa 
caggtcctgg 
gttaaggcta 
agatctaaat 
cacatccgct 
atcatggcaa 
cgccttatcg 
gtggtctcca 
ggacagcggg 
gcatatgaca 
tcaatctacc 
gagcggcttt 
cggtgccgcg 
aaggccgctg 
gacgaccttg 
gccttcacgg 
tacgacttgg 
ggcaaaaggg 
gagacagcta 
accttgtggg 
caacttgaaa 
gacctacctc 
tctccaggtg 
cgagtctgga 
gctgccactt 
ccaatcccgg 
ggagacatat 
ctactttctg 
ctccaggcca 
tttttttttt 
tggctccatc 
agagagtgct 



cgatactgcg 
tagcgttcgc 
ctgcagcacg 
ttcaccagtg 
tttgggattg 
tgccgcgatt 
ggggcgacgg 
aaaacggttc 
tccccattaa 
gggcgctgtg 
actacgtgac 
aattcttcac 
tcctacggga 
tcccatgcga 
acattacggc 
gctcatcagc 
actccccgga 
acatcacccg 
aagcggagga 
aattccctcg 
cctggaagga 
aggcccctcc 
tgtcttctgc 
tcgacagcgg 
ccgacgttga 
tcagcgacgg 
cgatgtccta 
tgcccatcaa 
catctcgcag 
acgaccacta 
aacttctatc 
ttggctatgg 
ccgtgtggaa 
aaaatgaggt 
tattcccaga 
ccctccctca 
tcgagttcct 
cccgctgttt 
aatgttgtga 
acatcggggg 
cgagcggtgt 
cggcctgtcg 
tcgttatctg 
aggctatgac 
agttgataac 
tgtactatct 
gacacactcc 
caaggatgat 
aagccctaga 
agatcattca 
agatcaatag 
gacatcgggc 
gtggcaagta 
ctgcgtccca 
atcacagcct 
taggggtagg 
ataggccatc 
tttttttttc 
ttagccctag 
gatactggcc 



tcggcacgtg 
ttcgcggggt 
agtcactcag 
gatcaacgag 
gatatgcacg 
gccgggagtc 
catcatgcaa 
catgaggatc 
cgcgtacacc 
gcgggtaggt 
gggcatgacc 
agaagtggat 
ggaggtcaca 
gcctgaaccg 
ggagacggct 
tagccagctg 
cgctgacctc 
cgtggagtca 
ggatgagagg 
agcgatgccc 
cccggactac 
gataccacct 
cttggcggag 
cacggcaacg 
gtcgtactcc 
gtcttggtct 
cacatggaca 
tgcactgagc 
cgcaaacctg 
ccgggacgtg 
cgtggaggaa 
ggcaaaggac 
ggacttgctg 
tttctgcgtc 
tttgggggtt 
ggccgtgatg 
ggtgaatgcc 
tgactcaacg 
cttggccccc 
ccccctgact 
actgacgacc 
agctgcgaag 
tgaaagcgcg 
tagatactct 
atcatgctcc 
cacccgtgac 
agtcaattcc 
cctgatgact 
ttgtcagatc 
acgactccat 
ggtggcttca 
cagaagtgtc 
cctcttcaac 
gttggattta 
gtctcgtgcc 
catctatcta 
ctgttttttt 
tccttttttt 
tcacggctag 
tctctgcaga 



ggcccagggg 
aaccacgtct 
atcctctcta 
gactgctcca 
gtgttgactg 
cccttcttct 
accacctgcc 
gtggggccta 
acgggcccct 
gctgaggagt 
actgacaacg 
ggggtgcggt 
ttcctggtcg 
gatgtagcag 
aagcgtaggc 
tctgcgcctt 
atcgaggcca 
gaaaataagg 
ggagtatccg 
atatgggcac 
gtccctccag 
tcacggagga 
ctcgccacag 
gcctctcctg 
tccatgcccc 
accgtaagcg 
ggcgccctga 
aactctttgc 
cggcagaaga 
ctcaaggaga 
gcctgtaagc 
gtccggaacc 
gaagacactg 
caaccagaga 
cgtgtgtgcg 
ggctcttcat 
tggaaagcga 
gtcactgaga 
gaagccagac 
aattctaaag 
agctgcggta 
ctccaggact 
gggacccaag 
gccccccctg 
tccaatgtgt 
cccaccaccc 
tggctaggca 
catttcttct 
tacggggcct 
ggccttagcg 
tgcctcagga 
cgcgctaggc 
tgggcagtaa 
tccagctggt 
cgaccccgct 
ctccccaacc 
cccttttttt 
ttcctctttt 
ctgtgaaagg 
tcaagt 



agggggctgt 
cccccacgca 
gtcttaccat 
cgccatgctc 
atttcaagac 
catgtcaacg 
catgtggagc 
ggacctgtag 
gcacgccctc 
acgtggaggt 
taaagtgccc 
tgcacaggta 
ggctcaatca 
tgctcacttc 
tggccagggg 
ccttgaaggc 
acctcctgtg 
tagtaatttt 
ttccggcgga 
gcccggatta 
tggtacacgg 
agaggacggt 
agaccttcgg 
accagccctc 
cccttgaggg 
aggaggctag 
tcacgccatg 
tccgt caeca 
aggtcacctt 
tgaaggcgaa 
tgacgccccc 
tatccagcaa 
agacaccaat 
aggggggecg 
agaaaatggc 
aeggattcca 
agaaatgece 
atgacatccg 
aggecataag 
ggcagaactg 
ataccctcac 
geacgatget 
aggacgaggc 
gggacccgcc 
cagtcgcgca 
cccttgcgcg 
acatcatcat 
ccatccttct 
gttactccat 
cattttcact 
aacttggggt 
tactgtccca 
ggaccaagct 
tcgttgctgg 
ggttcatgtg 
gatgaaeggg 
ttttcttttt 
tttccttttc 
tccgtgagcc 



gcagtggatg 
ctatgtgcct 
cactcagctg 
cggctcgtgg 
ctggctccag 
tgggtacaag 
acagatcacc 
taacacgtgg 
cccggcgcca 
tacgegggtg 
gtgtcaggtt 
cgctccagcg 
atacctggtt 
catgctcacc 
atctcccccc 
aacatgeact 
geggcaggag 
ggactctttc 
gatcctgegg 
caaccctcca 
gtgtccattg 
tgtcctgtca 
cagctccgaa 
cgacgacggc 
ggagccgggg 
tgaggacgtc 
egctgeggag 
caacttggtc 
tgacagactg 
ggcgtccaca 
acattcggcc 
ggccgttaac 
tgacaccacc 
caagccagct 
cctttacgat 
atactctcct 
tatgggcttc 
tgttgaggag 
gtcgctcaca 
cggctatcgc 
atgttacttg 
cgtatgcgga 
gagectaegg 
caaaccagaa 
egatgeatet 
ggctgcgtgg 
gtatgcgccc 
agctcaggaa 
tgagecaett 
ccatagttac 
accgcccttg 
gggggggagg 
caaactcact 
ttacagcggg 
gtgcctactc 
gagctaaaca 
tttttttttt 
tttcctttgg 
gettgactge 
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PatentansprQche 

1 . Hepatitis C Virus (HCV) Zellkultursystem, das im wesentlichen eukaryontische Zellen umfaBt, die eingeschleustes 
HCV-spezifisches Genmaterial enthalten , dadurch gekennzeichnet 

daB die eukaryontischen Zellen humane Hepatomazellen sind und daS das eingeschleuste HCV-spezifische 
Genmaterial ein HCV-RNA-Konstrukt ist, das die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, 
NS4B, NS5A, NS5B und 3' NTR und zusatzlich ein selektierbares Markergen (Selektionsgen) umfaBt 

2. Zellkultursystem nach Anspruch 1 , dadurch gekennzeichnet, 

daB die Hepatomazellen von einer handelsublichen Hepatomazellinie abstammen . 

3. Zellkultursystem nach Anspruch 1 , dadurch gekennzeichnet 

daB die Hepatomazellen aus einer Hepatomaprimarzellkultur gewonnen sind. 

4. HCV-RNA-Konstrukt, dadurch gekennzeichnet 

daB es die HCV-spezifischen RNA-Abschnitte 5* NTR, NS3, NS4A, NS4B, NS5A. NS5B und 3 f NTR und 
zusatzlich ein selektierbares Markergen (Selektionsgen) umfaBt. 

5. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, 

daB es eine NuWeotidsequenz gemSB einem der Sequenzprotokolle SEQ ID NO: 1 bis SEQ ID NO: 1 1 umfaBt. 

6. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet 

daB die 3' NTR eine NuWeotidsequenz aufweist, die aus der Gruppe der nachfolgend aufgelisteten NuWeotid- 
sequenzen (a) bis (i) ausgewShft ist: 

(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTT 
TTAGC 1 1 1 1 1 11 mi 1 C 11 11 1 1 1 1 " 1 GAGAGAGAGAGTCTC ACTCTG 
TTGCCCAGACTGGAGT 
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(b) ACCKKKjAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCC AGGCCAAT AGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA 
GAGTCTCACT CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAG^CAATAGGCCATCCTGTTTTTT 
TTTTT AGTCT TTTTTTTTTT C H I 1 1 1 i l l GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CI IT 11 1 1 IT TIT I'TCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 



7. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 6. dadurch gekennzeichnet, 

daB das selektierbare Markergen ein Resistenzgen und insbesondere eine Antibiotikaresistenzgen ist. 

8. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 6, dadurch gekennzeichnet, 

daB das selektierbare Markergen ein Neomycinphosphotransferasegen ist 

9. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 8. dadurch gekennzeichnet, 

daB das selektierbare Markergen strangabwarts der 5' NTR in die HCV-RNA integriert ist. 

10. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 9, dadurch gekennzeichnet, 
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daB das selektierbare Markergen Ober ein Ribozym bzw. eine Erkennungsstelle for ein Ribozym mit der HCV- 
RNA verbunden ist 

11. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 10, dadurch gekennzeichnet. 
daB es ein integriertes Reportergen aufweist. 

1 2. HCV-RNA-Konstrukt nach Anspruch 1 1 , dadurch gekennzeichnet 

daB das Reportergen ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloramphenicol-Acetayl- 
Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), der GFP-Gene (green-fluorescence-protein-Gene 
), dem GUS-Gen (Glukuronidasegen) und dem SEAP-Gen (Sezernierte-AIkalische-Phosphatase-Gen) ist 

1 3. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 1 1 . dadurch gekennzeichnet, 

daB deren Replikation die Expression eines (zellularen) Surrogatmarkergens beeinfluBt 

14. HCV-RNA-Konstrukt nach einem der AnsprOche 1 1 bis 13. dadurch gekennzeichnet 

20 daB das Resistenzgen derart in das offene Leseraster der HCV-RNA einWoniert ist, daB es erst nach einer pro- 

teofytischen Prozessierung in eine aktive Form uberfuhrbar ist. 

15. HCV-RNA-Konstrukt nach einem der AnsprOche 1 1 bis 14, dadurch gekennzeichnet 

25 daB das Reportergen und das selektierbare Markergen derart raumlich in dem Kbnstrukt angeordnet sind, daB 

sie gemeinsam ein Fusionsprotein exprimieren. 

16. Zelikultursystem nach einem der AnsprOche 1 bis 3 dadurch gekennzeichnet, 

30 daB das HCV-RNA-Konstrukt ein Konstrukt gemaB wenigstens einem der AnsprOche 4 bis 15 ist. 

1 7. Zelikultursystem nach Anspruch 1 , dadurch gekennzeichnet 

daB die das HCV-RNA-Konstrukt enthaltenden Zellen bei der DSMZ, Braunschweig, BRD, unter der Hinterle- 
35 gungsnummer DSM ACC2394 (Laborbezeichnung HuBI 9-13) hinterlegt sind. 

18. Verwendung eines Zellkultursystems nach einem der AnsprOche 1 bis 3 Oder 16 bis 1 7 und/oder eines HCV-RNA- 
Konstrukts nach einem der AnsprOche 4 bis 15 zur Herstellung und/oder Evaluierung und/oder Testung von The- 
rapeutika und/oder Diagnostika zur Behandlung von insbesondere HCV-lnfektionen. 

40 

19. Verwendung eines Zellkultursystems nach einem der AnsprOche 1 bis 3 oder 16 bis 17 und/oder eines HCV-RNA- 
Konstrukts nach einem der AnsprOche 4 bis 15 zur Herstellung eines Impfstoffes gegen HCV-lnfektionen. 

20. Verwendung eines HCV-RNA-Konstrukts nach einem der AnsprOche 4 bis 15 zur Herstellung einer leberzellspezi- 
45 fischen Gerrfahre for die Gentherapie . 

21. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 15. dadurch gekennzeichnet 

daB es ein integriertes Fremdgen aufweist und dazu geeignet ist dieses Fremdgen in eine Zielzelle einzu- 
50 schleusen, die zur Expression dieses Fremdgens geeignet ist. 

22. Verfahren zur Gewtnnung von zellkultur-adaptierten Mutanten eines HCV-RNA-Kbnstrukts gemaB einem der 
AnsprOche 4 bis 15, wobei die Mutanten gegenOber dem HCV-RNA-Konstrukt eine erhohte Replikationseffizienz 
aufweisen, dadurch gekennzeichnet, 

55 

daB man ein Zelikultursystem gemaB Anspruch 1 , bei dem das eingeschleuste HCV-spezifische Genmaterial 
ein HCV-RNA-Konstrukt mit Selektionsgen nach einem der AnsprOche 4 bis 1 5 ist, auf/in dem dem Selektions- 
gen entsprechenden Selektionsmedium kultiviert daB man die gewachsenen ZellWone erntet und daB man 
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aus diesen ZellWonen die HCV-RNA-Konstrukte Oder Teile davon isoliert 

23. Verfahren nach Anspruch 22, dadurch gekennzeichnet 

5 daB man die isolierten HCV-RNA-Konstrukte wenigstens einmal erneut passagiert namlich in Zellen eines 

Zellkultursystems nach Anspruch 1 einschleust dasdabei erhaltene Zellkultursystem gemaB Anspruch 1, bei 
dem das eingeschleuste HCV-spezifische Genmaterial das isolierte HCV-RNA-Konstrukt mit Selektionsgen 
ist, auf/in dem dem Selektionsgen entsprechenden Selektionsmedium kultMert, die gewachsenen ZellWone 
erntet und aus diesen ZellWonen die HCV-RNA-Konstrukte isoliert. 

10 

24. Verfahren zur Herstellung von Mutanten eines HCV-Vollangengenoms Oder eines HCV-Teilgenoms Oder eines 
beliebigen HCV- Konstrukts mit im Vergleich zu dem ursprOnglichen HCV-Vollangengenom Oder -Teilgenom Oder 
HCV-RNA-Kbnstrukt erhohter Replikationseffizienz, dadurch gekennzeichnet. 

is daB man mit einem Verfahren nach Anspruch 22 oder 23 eine zellkuftur-adaptierte Mutante eines HCV-RNA- 

Konstrukts herstellt und isoliert 

daB man die NuWeotid- und Aminosauresequenz dieser Mutante bestimmt und durch Vergleich mit der 
NuWeotid- und Aminosauresequenz des ursprOnglichen HCV-RNA-Konstrukts die Art, Anzahl und Positionen 
der NuWeotid- und Aminosaurernutationen bestimmt, 
20 und daB man diese Mutationen entweder durch gezielte Mutagenese oder durch Austausch von Sequenzab- 

schnitten, die die betreffenden Mutationen enthalten, in ein (isonertes) HCV- Vollangengenom oder ein HCV- 
Teilgenom oder ein beliebiges HCV-RNA-KonstruW einfOhrt. 

25. Zellkultur-adaptiertes HCV-RNA-Konstrukt mit hoher Replikationseffizienz, dadurch gekennzeichnet, 

25 

daB es durch NuWeotid- und/oder Aminosaure -Mutationen von einem HCV-RNA-Kbnstrukt nach einem der 
Anspruche 4 bis 1 5 ableitbar ist und daB es mit einem Verfahren nach einem der Anspruche 22 bis 24 erhaltlich 
ist 

30 26. Zellkultur-adaptiertes HCV-RNA-Kbnstrukt nach Anspruch 25, dadurch gekennzeichnet 

daB es einen Oder mehrere der nachfolgend aufgefuhrten Aminosaureaustausche aufweist, namlich 1283 arg 
-> gly und/oder 1383 glu -> ala und/oder 1577 lys -> arg und/oder 1609 lys -> glu und/oder 1 936 pro -> ser 
und/oder 2163 glu -> gly und/oder 2330 lys -> glu und/oder 2442 ile -> val aufweist. 

27. Zellkultur-adaptiertes HCV-RNA-Konstrukt nach Anspruch 25 oder 26, dadurch gekennzeichnet, 

daB es einen oder mehrere der in Tabelle 3 aufgefuhrten NuWeotid- und/oder Aminosaureaustausche auf- 
weist, wobei Tabelle 3 Bestandteil dieses Anspruchs ist 

40 

28. Zellkultur-adaptierte Mutanten eines HCV-RNA-Konstrukts oder eines HCV-Vollangengenoms mit im Vergleich zu 
dem ursprOnglichen HCV-RNA-Konstrukt Oder dem ursprOnglichen HCV-Vollangengenom erhShter Replikationsef- 
fizienz , dadurch gekennzeichnet 

45 daB sie mit einem Verfahren erhaWich ist, bei dem man in einem zellkultur-adaptierten HCV-RNA-Kbnstrukt 

nach Anspruch 24 durch Sequenzanalyse und Sequenzvergleich die Art und Anzahl der Mutationen bestimmt 
und diese Mutationen in ein HCV-RNA-Konstrukt, insbesondere in ein HCV-RNA-Konstrukt gemaB einem der 
AnsprOche 4 bis 15. oder in ein (isoliertes) HCV- RN A- Vollangengenom einfuhrt, entweder durch gezielte Muta- 
genese oder durch Austausch von Sequenzabschnitten, die die betreffenden Mutationen enthalten. 

50 

29. Hepatitis C Viruspartikel oder virus-ahnliche Partikel dadurch gekennzeichnet. 

daB sie mit einem Verfahren nach einem der AnsprOche 22-24 erhaltlich sind. 
55 30. Zellen, infiziert mit Hepatitis C Viruspartikeln oder virus-ahnliche Partikeln gemaB Anspruch 29. 
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